利用大模型的 zero-shot 与 few-show能力实现高质量的内容输出,通过API调用开发等多种形式让GPT-4、文心一言、chatgpt等大模型服务按照业务需求定向优化,集成开发
使用人工收集的高质量数据对大模型进行调优,提升大模型在某领域的定向能力。目前数据基于sample数量超千万,包含多轮对话、机器翻译、阅读理解、数学计算等场景、是国内领先的Fine-Tuning技术方案。
RLHF基于人类标注数据训练,让模型自我迭代,并具备类似人类的思维与语言能力,大幅度降低人工对数据的依赖,样本数据量可扩增至原始数据的5-10倍,大幅降低模型训练的数据量的门槛。