知识库搜索怎么做:Embedding https://github.com/ruoccofabrizio/azure-open-ai-embeddings-qna
评估使用Token数量的工具:https://gpttools.com/estimator
OpenAI的API价格计算器,选择OpenAI – Base Series Fine-tuned + Davinci http://azure.microsoft.com/en-au/pricing/calculator
参考配置 80 Hours Training + 730 Hours Hosting + 0 Inference = $ 32k/M
Fine-tuned很容易过拟合
Zero-shot / Few-shot 很强
Fine tuned
数据量不大:epoch 8-16
数据量很大:epoch 1-4
Learning rate慢慢加
谨慎选择,需要长期使用,否则Prompt Engineering更好
数据质量要求很高,Prompt completion高
参数要注意
结果是个费用,延迟,精度的妥协
示例Use case
OA自动化:表单OCR发票 → OpenAI → 合规检查
会议纪要:STT实时会议转写 → OpenAI → 自动会议主题 / 纪要 / Action Point
AI游戏直播:游戏视频 → 自动标签 + 场景描述 → 虚拟人直播介绍
RPA:语音标识 → OpenAI → PowerPlatform
OpenAI on Azure的区别
Rate Limit
Token上限
OpenAI用于研发,Azure用于生产环境
从Davinci开始测试,逐渐使用更便宜的模型
常见使用场景
客服机器人
舆情分析
Meta-prompt engineering
NER + Search Expansion + GPT
QA分类:把不能回答的问题扔给ChatGPT → Codex Query → + Context as Response