今天凌晨openai迎来了一次更新,除了新增了几个gpt-3.5-turbo-16k和gpt-3.54-turbo-16k模型外还新增了一个函数功能,那么这个函数功能到底是什么,我们来初探一下。
官方介绍
以下是openai官方本次更新的内容:
Chat Completions API中新增了函数调用功能。
更新了更可控的GPT-4和GPT-3.5 Turbo版本。
GPT-3.5 Turbo新增了16k上下文版本(相比标准的4k版本)。
嵌入模型费用降低了75%。
GPT-3.5 Turbo输入token费用降低了25%。
宣布了GPT-3.5 Turbo-0301和GPT-4-0314模型的废弃时间表。
函数功能的介绍:
开发者现在可以在gpt-4-0613和gpt-3.5-turbo-0613中使用函数,并使模型智能选择输出一个包含调用这些函数参数的JSON对象。这是一种更可靠地将GPT的功能与外部工具和API连接起来的新方法。
这些模型已经进行了微调,可以检测到何时需要调用函数(取决于用户的输入),并以符合函数签名的JSON进行回复。函数调用使开发者能够更可靠地从模型中获取结构化数据。例如,开发者可以:
创建通过调用外部工具(例如ChatGPT插件)来回答问题的聊天机器人。
将诸如“给安雅发电子邮件,询问她是否愿意在下周五喝咖啡”转换为send_email(to: string, body: string)这样的函数调用,或者将“波士顿的天气如何?”转换为get_current_weather(location: string, unit: ‘celsius’ | ‘fahrenheit’)。
将自然语言转换为API调用或数据库查询。
将“本月我的前十位客户是谁?”转换为内部API调用,例如get_customers_by_revenue(start_date: string, end_date: string, limit: int),或者将“上个月Acme公司下了多少订单?”转换为使用sql_query(query: string)的SQL查询。
从文本中提取结构化数据。
定义一个名为extract_people_data(people: [{name: string, birthday: string, location: string}])的函数,用于提取在维基百科文章中提到的所有人物。
这些用例是通过我们/v1/chat/completions端点中的新API参数(functions和function_call)实现的,开发者可以通过JSON Schema向模型描述函数,并可选择要求它调用特定的函数。请参阅我们的开发者文档以了解详情,并在发现需要改进函数调用的情况下添加评估(evals)。
函数测试
上面官方的介绍中说明了,只有gpt-4-0613和gpt-3.5-turbo-0613 和 16k的模型才能使用函数功能,如果你在gpt-3.5-turbo中使用会提示以下错误信息:
json复制代码{
”error”: {
”message”: “Unrecognized request arguments supplied: function_call, functions”,
”type”: “invalid_request_error”,
”param”: null,
”code”: null
}
}
下面我们使用一个例子来演示一下这个函数的作用:
curl复制代码curl https://api.openai.com/v1/chat/completions -u :$OPENAI_API_KEY -H ‘Content-Type: application/json’ -d ‘{
”model”: “gpt-3.5-turbo-0613”,
”messages”: [
{“role”: “user”, “content”: “北京今天的天气有多少摄氏度?”}
],
”functions”: [
{
”name”: “get_current_weather”,
”description”: “获取当前城市的温度”,
”parameters”: {
”type”: “object”,
”properties”: {
”location”: {
”type”: “string”,
”description”: “城市名称,例如:北京”
},
”unit”: {
”type”: “string”,
”enum”: [“celsius”, “fahrenheit”]
}
},
”required”: [“location”]
}
}
]
}’
从上面的参数可以看出跟之前的相比较多了functions参数,这个functions参数是一个数组形式,里面是你设定的需要获取到用户输入的一些关键词。该例中定义一个name为get_current_weather的函数名(可随便取),描述为获取给定位置的当前天气。它有两个参数:location表示城市名称,例如:北京;unit表示温度单位,可选值为”celsius”或”fahrenheit”。required定义哪些参数是必须的,只有匹配到必须的参数才认为这是一个函数实例。执行以上请求将会返回以下内容:
json复制代码{
”id”: “chatcmpl-7RDTsh2DwnXTYhQvAtclbEdnoXtdc”,
”object”: “chat.completion”,
”created”: 1686721032,
”model”: “gpt-3.5-turbo-16k-0613”,
”choices”: [
{
”index”: 0,
”message”: {
”role”: “assistant”,
”content”: null,
”function_call”: {
”name”: “get_current_weather”,
”arguments”: “{\n \”location\”: \”Beijing\”,\n \”unit\”: \”celsius\”\n}”
}
},
”finish_reason”: “function_call”
}
],
”usage”: {
”prompt_tokens”: 83,
”completion_tokens”: 25,
”total_tokens”: 108
}
}
从返回的参数可以看出如果匹配到你设定的内容他会响应多一个属性的内容,就是function_call。里面包含你前面设定的函数名get_current_weather和他匹配到的参数数组arguments。可以看到参数里面location的值是Beijing,单位是celsius摄氏度。题外话,这里参数内容返回的是英文拼写的beijing而不是用户输入的北京,按道理应该要原样返回用户输入的内容才合理。
大家看完这个例子是不是觉得这个功能很赞,确实方便了开发者去拓展新的功能,特别是结合公司自身业务,灵活度大大提高了,不再是一个无法控制的机器人了。有关函数的使用功能还有很多技巧,大家可以去发挥想象。