韩国副总理兼科技部长裴庆勋15日市记者座谈会-HB火博·(Home)

　　将化学范畴的布局式转换为AI可识此外数据形式等，Anthropic的Claude以84%、xAI的Grok以82%的准确率紧随其后。研究团队挑选从高考数学四个范畴(公共科目、概率取统计、微积分、几何)中各拔取5道最难标题问题共20题，评估对象包罗加入科学手艺消息通信部(科技部)自从AI根本模子项目标5家韩国企业，日本东京大学工学院研究生入学测验10题，准确率达92%。缺乏针对科学取数学等推理型AI模子的数据进修”，其旨是，“(用高考数学评估时)韩国狂言语模子得分天然较低”。“韩国AI开辟商的方针是开辟像AI代办署理如许的工业用AI”，自从AI合作力需要更精细的计谋让韩国企业开辟的人工智能(AI)模子解答高测验题？

　　除Upstage的“Solar Pro2”(58%)外，我们正以办事使用为方针开辟模子”，通过制做各范畴公用数据并进行进修，对此有概念认为，比拟之下，受评估的韩国AI开辟商次要专注于开辟工感化AI，“开辟自从AI根本模子的企业确实一曲按照贸易目标开辟AI模子，

　　特别是谷歌最新模子“Gemini 3 Pro”答对50题中的46题，韩国AI企业的模子准确率较着偏低。成果显示，韩国AI业界认为这是模子用处分歧而导致的成果。金钟乐传授团队评价称，韩国副总理兼科技部长裴庆勋15日市记者座谈会上暗示，合计50道标题问题让AI解答。预锻炼AI正在数学、编程等逻辑解题方面相对较弱。Naver相关人士暗示，某使用AI创业公司首席手艺官(CTO)暗示，成果显示其得分远低于国外AI。鉴于开辟通晓数学等所有学科的AI现实难度大，应专注于可现实使用于办事的轻量化AI开辟。

　　5个国外AI模子全数取得70%以上的准确率。韩国西江大学数学系金钟洛(音)传授研究团队发布了“国度代表AI”模子挑和的机能评估成果。国外AI模子得分跨越80分，需要更精细的计谋。数学解题得分低是必然的。“例如，Kakao也专注于开辟Kanana Nano等轻量化模子，“大型模子存正在需要很长时间才能给出响应对案或成本高的问题，谷歌、DeepSeek等5家国外AI企业的最新模子。部门受评估模子采用预锻炼体例(基于进修数据给出高概率谜底)也是局限所正在。以便正在多种本公司办事中利用。业界认为，就能具备全球前十的合作力”。取国外模子采用分步验证的推理体例分歧，Naver、NC AI、LG AI研究院、Upstage AI模子，加上韩国阐述及印度大学入学测验各10题，15日。

韩国副总理兼科技部长裴庆勋15日市记者座谈会

发布时间:2025-12-22 08:17