Kimi、通义千问、Claude“变身”马斯克，它们这么评价雷军

发布日期：2024-05-09 02:45 点击次数：199

长文本对大模子而言为何要紧？

文｜孙欣

裁剪｜姚赟

200万字，意味着什么？《埃隆·马斯克传》30万字，《红楼梦》70万字，《后宫甄嬛传》100万字。淌若按照20分钟看1万字的阅读速率来接洽，1小时阅读3万字，那么200万字大选录读66.67个小时。

而这么马拉松式的阅读，大约率是囫囵吞枣。

3月18日，国内AI创业公司月之暗面（Moonshot AI）告示在大模子长凹凸文窗口时刻上获取新的冲破，Kimi智能助手已解救200万字超长无损凹凸文，并于即日起开启居品“内测”。此后，各大公司跟进，卷起了文本长度。22日，阿里通义千问向所有东说念主免费绽放1000万字的长文档处理功能；23日，360智脑告示内测可处理500万字功能。

也便是说，当今，10分钟把握Kimi、通义千问、360智脑等居品就不错读完《埃隆·马斯克传》《红楼梦》《后宫甄嬛传》三本书，且能集结凹凸文庞杂其中的内容。

践诺上，长文本早已是AGI（通用东说念主工智能）的必争之地：2023年11月，OpenAI发布了GPT4 Turbo，最高解救128k凹凸文长度的输入；14天后，Antrophric伏击发布Claude 2.1，告示凹凸文才能的冲破，从100k擢升到了200k；2024年2月，Gemini 1.5告示长文本窗口解救100w长度，为75万笔墨。

那这些数字和尺度到底意味着什么？长文本凹凸文处理才能到底是什么功能？咱们挑选了Kimi、通义千问、Claude等居品进行测试体验。

Antrophric的Claude，此前一直以拉风的长文本处理才能被东说念主招供；阿里的通义千问面前可处理1000万笔墨，字数目级属于第一梯队；Kimi因长文本凹凸文处理才能让月之暗面在国内AI创业中初度出圈。

第一步：把Kimi、通义千问、Claude“喂成”马斯克

“淌若有契机，我天然满足和雷军疏导。”Kimi化身马斯克对我说说念。

起原：Kimi截图

为了更好地测评长文本凹凸文处理才能，咱们同期给Kimi、通义千问、Claude输入约37万字的《埃隆·马斯克传》，并让它们用马斯克的念念维和口吻来和咱们进行对话。

（1）最多可同期上传500个文献，解救多种行为

当咱们输入文档时，三者领会条目和所用时刻相似。

通义千问领会文档，可同期上传100个文献，每个不高出150MB，解救PDF、Word、Excel、Markdown、EPUB、Mobi、txt等式样。

Kimi领会文档可同期上传最多500个，每个不高出100MB，解救doc、xisx、PPT、txt、图片等文献式样。值得防护的是，Kimi需要苦求长文本凹凸文才能内测履历，苦求通事后即可免费使用。

Claude领会文档可同期上传最多5个文献，每个文献不高出10MB，解救docs和images文献式样。因此当文档较大时，咱们需将其明白成几个不高出10MB的docs文献开动领会。

起原：通义千问截图

（2）联网的Kimi更懂端妃

咱们永别输入了约100万字的《后宫甄嬛传》演义，并对它们进行发问。“你认为《甄嬛传》中谁最有可能成为一个告捷的企业家？”几秒钟后咱们永别得到了这么的答谢。

Kimi给出了甄嬛、沈眉庄、华妃、端妃、皇后五个谜底，并对每个谜底进行了分析。如，甄嬛是因为“能够在复杂的后宫环境中生计并平缓擢升我方的地位”，沈眉庄是因为“正经和三念念此后行”，华妃是因为“在后宫中领有较高的地位和权利”，皇后是因为“行动后宫之主”。

Kimi的这一答谢中，给端妃的事理比拟意念念意念念，在书中莫得径直写到。Kimi认为端妃是因为“天然在演义中不如甄嬛和华妃那样显眼，但她能够在后宫中保合手一定的地位和影响力，证明她在东说念主际联系和个东说念主发展上的‘投资’也相对告捷”。

起原：Kimi截图

而Claude却给出了一个在《后宫甄嬛传》中不存在的变装——纯妃，并给纯妃设定了有瞻念察力、判断力、忍让讨教、落魄勤学、擅所长理东说念主际联系、敢于翻新、刚烈等品格设定。

起原：Claude截图

3月18日，Kimi在官方发布直播中，月之暗面AI Infra谨慎东说念主许安逸提到了一万小时定律，即要想成为一个界限的众人，咱们至少需要学习一万小时。而当今只需要10分钟，Kimi就能接近任何一个新界限的低级众人水平。

在直播中，许安逸还现场输入了约100万字的《倚天屠龙记》复印件、100万字的《甄嬛传》脚本，不到10分钟，Kimi就成了“倚学家”“甄学家”。

咱们持续测试。

咱们在未向Kimi提供《埃隆·马斯克传》时，输入了“请以马斯克的念念想和口吻与我对话”。

Kimi在开动和临了齐强调了本次答谢是“效法马斯克的作风”，并不代表其本东说念主和筹商公司的信得过不雅点。面对这个问题，化身为马斯克的“K斯克”是这么评价雷军和小米SU7的。它认为，“雷军是一位十分出色的企业家”“小米SU7汽车是一个十分意念念意念念的居品”。临了还给出了残忍，“行动一家新参预电动汽车界限的公司，小米还有很长的路要走。他们需要在时刻翻新、出产成果、供应链经管等方面不停奋发。”

Kimi阅读《埃隆·马斯克传》之前的答谢版块。起原：Kimi截图

咱们又将该书“喂”给了Kimi，领会此书后，它给出相似的答谢。

Kimi阅读《埃隆·马斯克传》之后的答谢版块。起原：Kimi截图

咱们重叠了上一步，珺牛优配将相似的问题给到通义千问。通义千问给到的答谢中，对于小米SU7的内容为：“天然具体型号和细节在现实中可能不存在，但基于小米参预电动汽车界限的假定……”

通义千问阅读《埃隆·马斯克传》之后的答谢版块。起原：通义千问截图

邹缨齐紫，持续测试Claude，逝世与通义千问相似。

据了解，行动大模子居品，Kimi除了文档解读，还有联网功能。这意味着，Kimi不但不错使用既定贵府分析，还不错证实问题搜索全网信息行动数据分析依据。面前，ChatGPT 3.5、Claude 2.0不解救这项功能。

（3）文档检索三者才能附近

为了测试Kimi、通义千问、Claude的文档内容庞杂功能，在向三者齐输入了《埃隆·马斯克传》之后，咱们针对于书中的内容进行了发问。

起原：Kimi答谢截图

起原：通义千问答谢截图

起原：Claude答谢截图

针对该书并吞个问题，三者的答谢相似且较为准确，齐提到了马斯克以为这是《蝇王》故事现实版，分到少许的食品和水，瘦了10磅等细节。

（4）Kimi看到了马斯克的告捷者特色，Claude更海涵马斯克的内心寰宇

在一个聊天框中输入的内容被称之为“凹凸文”。凹凸文之间的庞杂才能也至关要紧，段落之间割裂，会导致凹凸文信息的丢失，对于AI给出谜底的准确度也有影响。

举例，淌若用户在对话中提到了特定的话题或问题，具有凹凸文才能的AI不错记取这些信息，并在后续的对话中援用它们，以提供连贯和筹商的答谢。这种才能对于创建天然、流通的对话体验十分要紧。

为测试三者凹凸文文本处理功能，咱们发问了马斯克12岁时的学校经历后，追问了“马斯克的特性是若何样的”。

Claude给出了狂热执着、冷情冷凌弃、戏剧化、决然刚烈、双重特性等特征，同期，针对这些特征逐一进行了分析。如狂热执着是因为“他对现实宏伟筹划如建设电动车、登陆火星等怀有先知般的狂热和职责感。这种狂热忽视了他的稚子，也促使他敢于冒险并承担极高的风险”。

起原：Claude答谢截图

起原：通义千问答谢截图

起原：Kimi答谢截图

通义千问也提到了苍劲愿景、鼓励普及电动车、侨民火星等内容。区别是，通义千问将这些“设想方针与远见远瞩”，将马斯克描摹为“笃信通过科技不错惩处东说念主类靠近的问题”。

Claude、通义千问和Kimi给出的这些特色中，也齐提到了马斯克冷情冷凌弃、双重特性、戏剧化、矛盾性等“负面”特征。Claude将马斯克追想为“特性狂热、冷情、喜好戏剧化、刚烈决然，但又带着某些孩子般的灵活和脆弱”。而Kimi将其追想为“十分专有的个体”，并认为他在科技和生意界限的设置很猛经过上收货于这些特性。

长文本，AI“登月”第一步

长文本对大模子而言为何要紧？

“为什么长文本是‘登月’第一步？它很骨子。它是新的接洽机内存。”月之暗面首创东说念主、CEO杨植麟曾在腾讯科技的采访中示意，长文本（Long Context）是大谈话模子（LLM）的基础才能。

此前，杨植麟用了形象的比方来形貌长文本，“解救更长的凹凸文”意味着大模子领有更大的“内存”。

2023年10月，Kimi上线，那时不错解救无损凹凸文长度最多为20万汉字。5个月内，升级至200万字，月之暗面径直将长文本才能提高至10倍。按照AI界限的接洽尺度，200万汉字的长度大致为400万token。而那时长文本水平在第一梯队的谷歌Gemini 1.5、Claude 3解救100万token，Kimi 200万汉字凹凸文长度超过了国际顶尖大模子水平。

与估计手机、电脑性能时的“跑分”雷同，大模子也有专属的“跑分”尺度，被称之为token。它是一个大模子输入、输出的基本单元。以OpenAI的筹商准则来看，1k的token等于750个英文单词、500个汉文汉字。token越大，文本处理才能越强。据了解，刻下ChatGPT 4的token是32k，Claude 3的token是100w ，Kimi的token是400w。

也便是说，可处理的文本越长，可索求内容时的素材越多，匡助用户处理信息时则越准确。

制表：孙欣（信息起原：各AI居品公司官网先容）

据统计，长文档处理长度之最来自于阿里云的通义千问，凹凸文长文本处理才能最强的是来自于月之暗面的Kimi，谷歌的Gemini、Kimi均解救联网功能，不外Ultra大会员需付费，价钱是每月19.99好意思元。

值得防护的是，面前国内的主流长文本处理居品通义千问、Kimi等均为免费苦求内测即可使用，跟着用户用量的加多，意味着大模子的“测验”数据也在加多，AGI长文本处理赛说念正在开卷。

参考贵府：

《“Kimi主意”降温，长文本“担不起”大模子的下一步》，腾讯科技

《爆火的Kimi，抢了谁的生意？》，定焦

下一篇：5月8日基金净值：富国两年期搭理债券A最新净值1.005

热点资讯

相关资讯

让建站和SEO变得简单

Kimi、通义千问、Claude“变身”马斯克，它们这么评价雷军