首页 > 科技信息 > 科技信息 > 微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把3.5淘汰了

微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把3.5淘汰了

发布时间:2024-04-23 15:37:06

Llama 3发布刚几天,微软就出手截胡了?

 

刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。

 

其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B

为了方便开源社区使用,还特意设计成了与Llama系列兼容的结构。

 

微软这次打出“手机就能直接跑的小模型”的旗号,4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上跑到每秒12 token。

 

这意味着,现在手机上能本地运行的最佳开源模型,已经做到ChatGPT水平。

 

在技术报告中还玩了一把花活,让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。

 

除了mini杯之外,小杯中杯也一并发布:

Phi-3-small,7B参数,为支持多语言换用了tiktoken分词器,并额外增加10%多语种数据。

Phi-3-medium,14B参数,在更多数据上训练,多数测试中已超越GPT-3.5和Mixtral 8x7b MoE。

(大杯他们目前不打算做)

作者阵容一看也不简单,一眼扫过去MSRA和MSR雷蒙德团队都投入了不少人。

 

那么,Phi-3系列到底有什么独特之处呢?

根据技术报告中披露,其核心秘诀就在于数据

去年团队就发现,单纯堆砌参数量并不是提升模型性能的唯一路径。

反而是精心设计训练数据,尤其是利用大语言模型本身去生成合成数据,配合严格过滤的高质量数据,反而能让中小模型的能力大幅跃升。

也就是训练阶段只接触教科书级别的高质量数据,Textbooks are all you need

 

Phi-3也延续了这一思路,这次他们更是下了血本:

  • 投喂了多达3.3万亿token的训练数据(medium中杯是4.8万亿)
  • 大幅强化了数据的”教育水平”过滤
  • 更多样化的合成数据,涵盖逻辑推理、知识问答等多种技能
  • 独特的指令微调和RLHF训练,大幅提升对话和安全性

举个例子,比如某一天足球比赛的结果可能对于大模型是良好的训练数据,但微软团队删除了这些加强知识的数据,留下更多能提高模型推理能力的数据

这样一来,对比Llama-2系列,就可以用更小的参数获得更高的MMLU测试分数了。

科技信息更多>>

合资品牌还能再战吗?一汽-大众给出最新答案 AR的迈巴赫S,当年的43远不如现在的64火爆! 6月销量榜出炉 蔚来真的掉队了? N7销量可观:东风日产干的热火朝天,日产总部却危如累卵 6月新能源汽车销量出炉:比亚迪37.8万辆、吉利12.2万辆、鸿蒙智行5.3万辆…… 增配降价!2025款欧拉好猫正式上市,7.98万元起 新势力6月交付量出炉!零跑、小鹏、小米等车企交付量创新高! 三年后来谢我!今年买车哪怕多花钱,最好买这四种车,至少不后悔 比亚迪巴西工厂首车下线 开启拉美新能源产业新篇章 兰博基尼Fenomeno预告图发布 将于8月亮相 小鹏G7将于7月3日正式上市 预售价23.58万元起 “拆分”红旗H5 PHEV:选材、标准向豪车看齐,安全细节很到位 2026款起亚赛图斯将于7月2日上市、小鹏G7官宣7月3日上市 小米YU7创造新纪录 一周重点新车盘点 2025款传祺M8——全面解析:豪华MPV的巅峰进化 2025年大连市长海县银龄教师招聘公告(6人) 2025年调兵山市招聘临床医师公告(10人) 2025年大连医科大学第二批招聘高层次人才公告(3人) 2025年大连金普新区卫生系统招聘事业编制工作人员公告(164人) “车谷造·全球行”对法推介会举行 “东风车”深度开拓欧洲市场 直击2025上海车展:芯片厂商携“法宝”竞相登场 车载芯片将目光瞄向优化整车成本 长安汽车发布蓝鲸500Bar超高压直喷发动机 欧拉闪电猫旅行版亮相,经典新生! 2027年销量破500万辆,吉利控股要用“一三三”战略夺回第一 智能座舱下,健康与AI并行的创维汽车 A0级纯电市场的全新挑战者! 宝马再次加入“价格战”,降幅达16万还是后驱,宝马iX3能抄底吗 新款大众ID.4 CROZZ来袭!动力、智能升级,一口价14.99万起值吗? 极氪009新增浩瀚智驾2.0选装包 智驾功能升级 新能源行业高质量发展,鲸充全力以赴,获行业多个荣誉奖项!