当前位置:首页 > 基金 > 彰显AI科技能力 汽车之家仓颉大模型获SuperCLUE汽车知识测评最高分

彰显AI科技能力 汽车之家仓颉大模型获SuperCLUE汽车知识测评最高分

2025年08月15日63196

近日,专业中文大模型测评机构SuperCLUE发布最新一期《SuperCLUE-AutoQA 中文大模型汽车知识测评基准总榜》。在此次测评中,汽车之家自研“仓颉大模型”以72.96分的总成绩位居6个参评大模型榜首。这一佳绩不仅充分印证了仓颉大模型在汽车垂直领域的卓越性能,为其在更多终端场景的应用落地筑牢基础,更直观展现了汽车之家“ALL in AI”战略转型的坚定决心与阶段性突破成果。

彰显AI科技能力 汽车之家仓颉大模型获SuperCLUE汽车知识测评最高分
图片来源于网络,如有侵权,请联系删除

据了解,本次测评内容涵盖汽车咨询、汽车对比、汽车推荐、汽车资讯、用车问题5个一级维度及11个二级子维度,旨在为中文大模型汽车知识领域的评估提供全面且多维的参考。测试题目由SuperCLUE机构独立开发,分为客观题与主观题两类,通过两轮测试综合考量大模型在信息时效性、事实准确性、答案一致性和理解用户意图等方面的能力。测评结果显示,在5个一级维度中,汽车之家仓颉大模型在汽车咨询、汽车对比、汽车推荐、汽车资讯4个维度均位居第一,用车问题维度位列第二。

成绩的背后,是汽车之家仓颉大模型在模型能力、知识架构和数据资源层面构筑的三重壁垒。

着眼真实场景 打造三大优势能力

深耕汽车行业20年,汽车之家对行业发展和用户行为已有深刻理解,并以此为基础重点优化仓颉大模型的三项核心能力,使其更适应当下真实交互场景,为用户提供更具价值的回应。

首先,“懂用户,善理解”。随着汽车消费市场逐渐成熟,用户向大模型咨询选购建议时,通常会提出包含多个条件的明确需求,例如“家里有两个小孩,预算20万左右,想要空间大的SUV,最好是今年新款,有什么推荐吗?”。这要求大模型具备在多条件中提取、整合并推理正确答案的能力。测评结果显示,面对这类问题时,仓颉大模型的答案准确性显著更高。

其次,“不顺从,懂澄清”。新车型更新速度快,消费者难以及时掌握全部准确信息,提问中可能夹带过时或错误内容。测评记录显示,与通用大模型往往顺应用户表述不同,仓颉大模型会先依据自身知识库核实信息,识别其中不准确之处并向用户澄清,确保回答基于真实有效的数据。

最后,“不编造,给解法”。实际交流中,部分提问本身不存在有效答案,例如用户询问“一款已停产车型的最新优惠政策”。面对这种情况,仓颉大模型不会随意编造答案,而是明确告知车型已停售,补充相关二手车行情信息,同时推荐具有类似特点的在售车型,帮助用户获得更具参考价值的选择。

提升信息质量 构建专业知识图谱

对于大模型而言,调用信息的质量直接影响输出结果。为提升回答准确度、最大程度降低AI幻觉出现概率,汽车之家发挥垂直领域优势,为仓颉大模型构建了全新的信息检索链路。

目前,通用大模型较多采用对用户提问即时检索、扩散搜索的方式,即全网搜索包含相关信息的网页,再从网页中提炼、分析和推理后给出回复。

而汽车之家依托完备的车型库体系、海量专业测评结果、真实口碑信息和全面汽车百科,为仓颉大模型搭建了完整的结构化汽车领域知识库和知识图谱。因此,仓颉大模型在回答用户提问时,仅需在这些高质量信息中筛选总结,排除了绝大部分干扰信息,既提升了信息处理效率,又有效保障了回答准确率。

挖掘数据资产 筑起专有信息壁垒

数据量是影响大模型推理结果的另一重要因素。QuestMobile发布的《2025中国移动互联网半年大报告》显示,2025年6月,汽车之家全景生态总用户量达5.02亿,日均用户量达8151.91万。庞大的用户体量叠加20年积累,为仓颉大模型提供了丰厚的数据资产,其中大量私有化数据更是价值显著。

不可否认,汽车之家网站发布的公开信息,通用大模型也可获取。因此,正是私有化数据的加持,让仓颉大模型在汽车知识领域实现“遥遥领先”——用户浏览行为、最新成交底价、真实续航里程等未经加工的、通用大模型无法获得的数据筑起牢固的信息壁垒,使仓颉大模型相比通用大模型能更深刻理解业务场景、更准确识别用户意图、更全面进行推理思考,最终给出更具价值的回答。

通过本次测评,也能发现仓颉大模型在部分方面仍有提升空间。对此,汽车之家CTO项碧波表示:“成立20年以来,汽车之家一直坚持‘用户第一’的价值观,不断在内容、产品、技术、服务上投入,优化用户看车、买车、用车、换车的体验。在AI时代,汽车之家敏锐意识到AI技术有机会帮助我们跨越式提升用户体验,因此在2025年将‘ALL in AI’作为公司核心战略。仓颉大模型正是为更好解决汽车领域问题而专门研发的行业大模型,我们始终认为‘行业问题需要用行业大模型来解决’。感谢SuperCLUE的测评和反馈,其全面、务实的评价体系让我们对自研的仓颉大模型有了更客观的认识。仓颉大模型在汽车知识领域取得的领先优势,坚定了我们持续投入的信心;同时评测反馈的问题也让我们更清晰地认识到需要提升的方向。汽车之家将继续依托20年行业深耕和全景生态数据优势,不断迭代模型的理解力、推理力与执行力,让AI真正懂车、懂用户、懂场景,并将仓颉大模型的能力应用到各个业务场景中,为所有买车用户提供选车省心、买车省钱的智能服务。”

据了解,SuperCLUE是大模型时代CLUE基准的发展与延续。后者发起于2019年,是一项致力于科学、客观、中立的语言模型测评基准。SuperCLUE基于多年测评经验,结合通用大模型在学术、产业与用户侧的广泛应用,构建了多层次、多维度的综合性测评基准,其测评结果在业内广受认可并被广泛引用。

【责任编辑:王岩】
    阅读下一篇:

              扫描二维码推送至手机访问。

              版权声明:本文由财经简讯发布,如需转载请注明出处。

              本文链接:https://cjjx.daiweicd.com/post/14487.html

              “彰显AI科技能力 汽车之家仓颉大模型获SuperCLUE汽车知识测评最高分” 的相关文章

              抖音将建立安全与信任中心,推进算法和平台治理透明化

              抖音将建立安全与信任中心,推进算法和平台治理透明化

                1月3日,抖音宣布将推出10项措施,建立安全与信任中心,切实推动算法和平台治理透明化,创建安全与信任的平台环境,打造更良好的网络生态。图片来源于网络,如有侵权,请联系删除  抖音方面表示,将以安全与信任中心为依托,重点介绍社会关切的议题,包括算法原理,审核机制,打击网暴、谣言等平台治理工作,未成...

              我国载人月球探测工程登月阶段任务稳步推进

              我国载人月球探测工程登月阶段任务稳步推进

                记者3日从中国载人航天工程办公室获悉,2025年中国载人航天工程将扎实推进空间站应用与发展和载人月球探测两大任务。目前中国空间站在轨运行稳定、效益发挥良好,载人月球探测工程登月阶段任务各项研制建设工作按计划稳步推进。图片来源于网络,如有侵权,请联系删除  据悉,2025年,工程规划了2次载人飞行...

              国产手术机器人:从“跟跑”到“并跑”

              国产手术机器人:从“跟跑”到“并跑”

              图① 观众观看一款手术机器人演示。图片来源于网络,如有侵权,请联系删除新华社记者 鞠焕宗摄 图片来源于网络,如有侵权,请联系删除图② 骨科医疗手术机器人。视觉中国供图 图③ 单孔腔镜手术机器人演示剥蛋壳。新华社记者 张玉薇摄 荆晓青制图  真正的突破在于构建起...

              泽连斯基称乌方愿在美方领导下尽快开启和谈

              泽连斯基称乌方愿在美方领导下尽快开启和谈

                当地时间3月4日,乌克兰总统泽连斯基表示,他对此前在白宫与美国总统特朗普的会晤没有取得成果感到遗憾。他表示,乌克兰已做好准备“在特朗普的领导下”实现和平。他和乌方团队愿尽快开启谈判以实现持久和平。图片来源于网络,如有侵权,请联系删除   关于美乌矿产协议,泽连斯基表示,乌方愿在任何时间、以任何...

              特朗普:将立即对加拿大“增加同等数额的对等关税”

              特朗普:将立即对加拿大“增加同等数额的对等关税”

                当地时间3月4日,美国总统特朗普在社交媒体上表示,加拿大对美征收报复性关税将立即引发美国“增加同等数额的对等关税”。图片来源于网络,如有侵权,请联系删除   特朗普在其私人社交媒体平台发文称,“请转告加拿大总理特鲁多,若他对美国征收报复性关税,我们的对等关税将立即以同等数额增加。”图片来源于网...

              第四届青山科技奖揭晓 助力绿色低碳科研成果进入“百姓家”

              第四届青山科技奖揭晓 助力绿色低碳科研成果进入“百姓家”

                3月3日,第四届青山科技奖获奖名单正式揭晓,10位绿色低碳领域的青年科学家入选,他们每人将获得税后100万元奖金,用途可自由支配。图片来源于网络,如有侵权,请联系删除  为助力更多科研力量投身绿色和可持续领域的科技研发,促进绿色低碳基础科研及技术成果转化,美团于2021年发起资助青年科学家的公益...