摘要: 百川大模型操作体验,作为老牌大厂的搜狗,其前CEO王小川如今倾力打造这款产品,作为国内为数不多在AI研究得较早的团队,其产品凭借着过硬的实力给我们用户展现着GPT的涌现功能,相比起宣传的参数,我相信用户具体的使用感受会更直观。前段时间我体验了一下这个模型并且对于其综合能力进行测评,大家可以根据测评结果看是否将百川纳入你的GPT使用名单~
百川智能大模型综合测评
前言
百川大模型操作体验,作为老牌大厂的搜狗,其前CEO王小川如今倾力打造这款产品,作为国内为数不多在AI研究得较早的团队,其产品凭借着过硬的实力给我们用户展现着GPT的涌现功能,相比起宣传的参数,我相信用户具体的使用感受会更直观。前段时间我体验了一下这个模型并且对于其综合能力进行测评,大家可以根据测评结果看是否将百川纳入你的GPT使用名单~
企业概况
详细了解:https://www.36kr.com/p/2482409567950721
注册/登录步骤
注册登录网址:https://www.baichuan-ai.com/home
如果我们还是不太知道怎么去具体使用,可以设定角色背景让GPT进一步回答
现在国产大模型百花齐放,第一批发布的就有多少个,然后我们来看看百川大模型自己认为的优势所在。
综合能力测评
文本生成
知识获取和解释
创意表达和艺术
逻辑推理和问题解决
自然语言处理
对话和人机互动
创造性写作
反事实推理
总结
通过如上使用,百川大模型在上述各种示例中都处理的不错,能满足我们日常的一些基本使用。但和其他大厂的大模型比起来也有这么几个较为明显的不足:
- 不支持联网,无法实时获取最新的信息。这点还是比较重要的,这意味着智能在过去的知识库上进行加工,比如你想针对最近的时事热点进行写作和分析,百川大模型就可能满足不了我们的需求。
- 没有多模态,目前只支持文本识别,语音和文生图和图生图等技术目前还不支持。目前看来只适合文本工作者。
- 没有一个应用市场等生态,如果你想针对于你的场景进行更高阶的使用,就需要自己编写专业的prompt,而他对于更专业的prompt的理解能力还没有测试。
- 在准确性和创造性等方面没有给用户一个明显的选择,在针对不同场景的时候需要我们自己设置温度值,来切换他回答的准确性和创造性。
百川智能大多数是原来搜狗团队的人,在文本这一块他们积累了丰富的经验和能力,我们也希望他们在其他方面也能做的越来越好,对于我们用户而言,谁会拒绝多一个好用且免费的大模型呢?
© 版权声明
文章版权归作者所有,未经允许请勿转载。