首页 > 科技信息 > 科技信息 > 腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译

腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译

发布时间:2025-11-25 18:43:53

11月25日,腾讯混元于11月25日推出开源OCR模型HunyuanOCR,该模型参数量为1B,基于混元原生多模态架构构建,在多项OCR应用评测中取得当前最优效果。

腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译

该模型采用端到端训练推理范式,通过单次前向推理即可完成多项任务,相比传统级联方案更具效率优势。其架构由原生分辨率视频编码器、自适应视觉适配器与轻量化语言模型三部分组成。

在性能方面,HunyuanOCR在复杂文档解析评测OmniDocBench中获得94.1分,超过谷歌Gemini3-pro等模型;在涵盖文档、街景、手写等九大场景的测试集上,其文字检测与识别能力领先同类开源及商业模型。同时,该模型支持14种小语种翻译,并在ICDAR2025文档翻译比赛中获得小模型赛道冠军。

目前该模型已应用于票据字段抽取、视频字幕识别及拍照翻译等场景,并正式对外开放源代码。

科技信息更多>>

赵福全:AI是人类社会发展的拐点,汽车产业需正确认知与系统布局 法拉第未来Super One首批整套零部件将启运离港 两年前小鹏想要淘汰混动,两年后小鹏转身拥抱增程 给新能源汽车系上安全带 立中集团子公司拟引入战投昆仑新材 加速固态电池材料等布局 华为MatePad Edge发布:5999元起 配合磁吸键盘可转换为笔记本形态 华为Mate X7折叠屏手机发布:12999元起,搭载第二代红枫影像技术 华为发布新款非凡大师手表,售价24999元 华为Mate80 RS非凡大师手机发布:11999-12999元 马斯克开始用Grok替代员工了!最惨部门裁员90% 腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译 “老登”俞敏洪,不背用员工血汗钱旅游的“锅” 140亿“风投女王”,豪掷3亿美元收购字节股份 极狐全新阿尔法T5上市,限时售价10.98万元起 东南亚车市|菲律宾9月新车销量同比下降4% 盖世汽车CEO周晓莺担任常熟市汽车电子产业发展专家顾问 诺玛科集团新能源汽车副车架项目落户江宁 欧盟、中国将举行会谈 旨在化解稀土贸易争端 丰田最早将于2027年开始在越南生产混合动力汽车 9月下期〡现代携手三星推出一体化控制服务;丰田推出e-Palette移动出行工具;本田研发化学分选技术,提高报废汽车塑料的回收纯度与工业可行性 夏普电动汽车将于2027年首次亮相 小鹏汽车副总裁回应何小鹏职务变化:“执行董事”统一更新为“董事” 日产拟返销美国产SUV至日本,楼兰车型在列 华爱兴耀闭式空悬ASU(闭式空气悬挂供气单元) | 申报2025第七届金辑奖最具成长价值奖 9月车企销量TOP10:赢家到底是谁? 2025年最后一个季度倒计时:40万汽修厂不打价格战,如何让业绩再增50%? 最大4S集团向上,最大汽服连锁向下:售后进入全面竞争时代? 9月车型销量TOP20:小米YU7首超问界M8,微小型车集体创新高 赛力斯赴港IPO,选择比努力更重要? 起亚拟在斯洛伐克工厂大幅提升电动汽车产量