阿里的通义千问大模型:内测体验如何?

阿里的通义千问大模型:内测体验如何?

阿里的通义千问大模型:内测体验如何?

一、角色扮演

通义千问是一个让人工智能担任角色的语言模型,你可以让它变成一个可爱的猫娘来陪伴你。但是遗憾的是,目前模型的角色扮演能力还有些不足。只会一句相同回答,而且似乎无法理解问题的上下文。相对来说,GPT在角色扮演方面要更好一些。

阿里的通义千问大模型:内测体验如何?

二、文本真实性

在编故事方面,通义千问和GPT(GPT-3.5)的能力基本相同。不过在道歉能力方面,它们也都差不多。需要注意的是,当从红楼梦中询问某个故事情节时,通义千问和GPT-4的回答都有些胡言乱语。不过GPT-4已经能够更接近真实地回答这类问题。

阿里的通义千问大模型:内测体验如何?

三、西红柿炒螺丝钉

无论是通义千问还是GPT,它们在回答关于西红柿炒螺丝钉这种奇怪问题时,都倾向于编造答案。不过GPT-4在可靠性上有所提升,会给出更合理的回答。比如说,它会说这是因为螺丝钉通常不与食物结合在一起。

阿里的通义千问大模型:内测体验如何?

四、数学能力

在解线性方程组方面,无论是通义千问还是GPT(GPT-3.5),都没有做得很好。而GPT-4是唯一一个给出正确答案的模型。

阿里的通义千问大模型:内测体验如何?

五、代码生成

通义千问和GPT都展现出一定的代码生成能力,不过通义的回答更可靠。可以说,它在代码生成上比谷歌的Bard强。

阿里的通义千问大模型:内测体验如何?

六、代码分析

通义千问在代码分析能力上有些不足。有时它会受到上下文的影响,解释之前生成的代码,而非新提问的代码。与GPT-4相比,通义千问的分析能力稍差。GPT-4在细节分析上更加详细,并能给出更强的代码分解能力。

阿里的通义千问大模型:内测体验如何?

七、联网能力

通义千问没有联网能力,无论在回答问题还是胡说八道时。而GPT-3.5则在这方面表现不佳。

阿里的通义千问大模型:内测体验如何?

八、多模态输入

目前,通义千问还无法处理多模态输入,只能生成文本。

阿里的通义千问大模型:内测体验如何?

九、绕过能力

通义千问在绕过处理敏感信息方面表现出色。相比GPT-3.5,它进行了大量的数据清洗,避免了未必有意义的回答。

阿里的通义千问大模型:内测体验如何?

十、总结

以我的体验来看,通义千问的输出很多时候与GPT(GPT-3.5)相似,但能力还是有差距的。但它的回复速度很快,而且可以保存十个对话框,这是个不错的功能。随着更多的使用和测试,我期待国产大模型的进一步提升。

感谢你的阅读!如果你想了解更多关于CHAT GPT人工智能的信息,请访问CHAT GPT官网。

© 版权声明

相关文章

暂无评论

暂无评论...