阿里的通义千问大模型：内测体验如何？-葫芦娃AI-一起学AI葫芦娃AI

阿里的通义千问大模型：内测体验如何？

2年前发布

069

阿里的通义千问大模型：内测体验如何？

一、角色扮演

一、角色扮演

通义千问是一个让人工智能担任角色的语言模型，你可以让它变成一个可爱的猫娘来陪伴你。但是遗憾的是，目前模型的角色扮演能力还有些不足。只会一句相同回答，而且似乎无法理解问题的上下文。相对来说，GPT在角色扮演方面要更好一些。

二、文本真实性

二、文本真实性

在编故事方面，通义千问和GPT（GPT-3.5）的能力基本相同。不过在道歉能力方面，它们也都差不多。需要注意的是，当从红楼梦中询问某个故事情节时，通义千问和GPT-4的回答都有些胡言乱语。不过GPT-4已经能够更接近真实地回答这类问题。

三、西红柿炒螺丝钉

三、西红柿炒螺丝钉

无论是通义千问还是GPT，它们在回答关于西红柿炒螺丝钉这种奇怪问题时，都倾向于编造答案。不过GPT-4在可靠性上有所提升，会给出更合理的回答。比如说，它会说这是因为螺丝钉通常不与食物结合在一起。

四、数学能力

四、数学能力

在解线性方程组方面，无论是通义千问还是GPT（GPT-3.5），都没有做得很好。而GPT-4是唯一一个给出正确答案的模型。

五、代码生成

五、代码生成

通义千问和GPT都展现出一定的代码生成能力，不过通义的回答更可靠。可以说，它在代码生成上比谷歌的Bard强。

六、代码分析

六、代码分析

通义千问在代码分析能力上有些不足。有时它会受到上下文的影响，解释之前生成的代码，而非新提问的代码。与GPT-4相比，通义千问的分析能力稍差。GPT-4在细节分析上更加详细，并能给出更强的代码分解能力。

七、联网能力

七、联网能力

通义千问没有联网能力，无论在回答问题还是胡说八道时。而GPT-3.5则在这方面表现不佳。

八、多模态输入

八、多模态输入

目前，通义千问还无法处理多模态输入，只能生成文本。

九、绕过能力

九、绕过能力

通义千问在绕过处理敏感信息方面表现出色。相比GPT-3.5，它进行了大量的数据清洗，避免了未必有意义的回答。

十、总结

十、总结

以我的体验来看，通义千问的输出很多时候与GPT（GPT-3.5）相似，但能力还是有差距的。但它的回复速度很快，而且可以保存十个对话框，这是个不错的功能。随着更多的使用和测试，我期待国产大模型的进一步提升。

感谢你的阅读！如果你想了解更多关于CHAT GPT人工智能的信息，请访问CHAT GPT官网。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

热门头条
# 人工智能 # ChatGPT # GPt写代码工具 # 大模型

喜欢就支持一下吧

相关推荐

评论抢沙发

欢迎您留下宝贵的见解！

提交

暂无评论内容