首页 > 科技信息 > 科技信息 > 驱动增强终端侧生成式AI体验的技术:多模态生成式AI

驱动增强终端侧生成式AI体验的技术:多模态生成式AI

发布时间:2024-05-11 16:37:39来源: 152102

改善情境化和定制化一直是用户体验的长期需求。例如,消费者希望终端能够自动利用来自智能手机数据和传感器的情境信息和自定义偏好,让体验更直观和无缝,比如基于当前位置、时刻和食物选择偏好推荐餐厅用餐,创造愉悦体验。

尽管生成式AI已展现出新兴的和变革性的能力,但其仍有很大改进空间。类似多模态生成式AI等这样的技术可应对生成式AI更加情境化和定制化的体验趋势。

多模态生成式AI模型输入和输出多种模态,以提供更佳响应和答案

多模态AI模型能够更好的理解世界

大语言模型(LLM)为纯文本训练模型带来了惊艳的能力。如果模型能够支持包含更多知识的不同信息形式,能带来怎样的提升呢?

人类能够通过语言和阅读文字学到很多东西,但也需要通过各种感官和互动形成对世界的理解:

我们的眼睛让我们能够看到球在倾斜地面上滚动的场景,以及当球滚到沙发后面会如何消失。

我们的耳朵可以识别语音中的情绪或警报声来源的方向。

我们与世界的接触和互动让我们知道如何用手握住泡沫塑料咖啡杯,以及如何在走路时避免摔倒。

类似的例子不胜枚举。

尽管语言可以描述几乎所有这些事情,但它可能不如其他模态做得那么好或那么高效。

正如人类需要利用各种感官学习,生成式AI除了利用文本之外还可以使用更多其他模态学习:这正是多模态生成式AI模型的作用所在。

多模态生成式AI模型可基于一系列模态进行训练,包括文本、图像、语音、音频、视频、3D、激光雷达(LIDAR)、射频(RF)、以及几乎任何传感器数据。

通过利用所有这些传感器,融合数据,并更全面地理解世界,多模态生成式AI模型可以提供更佳答案。AI研究人员已经做到了这一点,他们利用不同模态的一系列数据在云端训练多模态大模型(LMM),让模型更“智能”。OpenAIGPT-4V和谷歌Gemini就是这类LMM。

这能给用户带来什么?举例来说,LMM可以充当通用助手,接收任何模态的输入,为更广泛的问题类型提供大幅改进的答案。比如基于复杂的停车标志回答用户可否停车,或基于振动噪音回答用户该如何修理洗碗机故障。

下一步,部署LMM进行推理:尽管生成式AI推理可在云端运行,但在边缘终端侧运行有着诸多好处,比如隐私、可靠性、成本效益和即时性。

例如,传感器和相应的传感器数据来源于边缘终端,因此在终端侧处理和保存数据更具成本效益和可扩展性。

终端侧LLM现在具备视觉理解能力

高通AI研究近期演示了全球首个在Android手机上运行的多模态LLM。我们展示了一个超过70亿参数的大语言和视觉助理大模型(LLaVA),其可接受包括文本和图像在内的多种类型的数据输入,并生成关于图像的多轮对话。通过全栈AI优化,LLaVA能够在搭载第三代骁龙8移动平台的参考设计上以实时响应的速度在终端侧生成token。

具有语言理解和视觉理解能力的LMM能够赋能诸多用例,例如识别和讨论复杂的视觉图案、物体和场景。

例如,视觉AI助手可以帮助视力障碍者更好地理解周围环境并与之互动,从而提高生活质量。

终端侧LLM现在具备听觉理解能力

在搭载骁龙XElite的WindowsPC上,高通近期还展示了全球首个在终端侧运行的超70亿参数的LMM,可接受文本和环境音频输入(如音乐、交通环境音频等),并基于音频内容生成多轮对话。

音频提供的更多情境信息可以帮助LMM针对用户的提示给出更佳答案。我们很高兴看到终端侧LMM现已支持视觉、语音和音频模态,并期待对更多模态的支持。

生成式AI时代刚刚开始,无限创新即将到来

更多终端侧生成式AI技术进步即将到来

打造能够更好理解情境信息的AI模型是获得更佳答案和体验提升的必要条件,多模态生成式AI正是即将应用于未来终端的最新变革性技术之一。欢迎阅读博客第二部分,我将深入介绍LoRA,探究它将如何帮助应对现有挑战,为消费者和企业规模化提供情境化、定制化和个性化体验。

科技信息更多>>

2027年销量破500万辆,吉利控股要用“一三三”战略夺回第一 智能座舱下,健康与AI并行的创维汽车 A0级纯电市场的全新挑战者! 宝马再次加入“价格战”,降幅达16万还是后驱,宝马iX3能抄底吗 新款大众ID.4 CROZZ来袭!动力、智能升级,一口价14.99万起值吗? 极氪009新增浩瀚智驾2.0选装包 智驾功能升级 新能源行业高质量发展,鲸充全力以赴,获行业多个荣誉奖项! 销量创历史新高!深度剖析“睿蓝模式销量密码” 深化交流凝智慧 同向同行谋发展——郴州市第一职业中专到永州市工商职业中专考察交流 2024年四川凉山喜德县卫生健康局招募村医生20人公告 广东中山市公安局三角分局辅警招聘8人公告 2024年贵州福泉市第一医共体招聘14人简章 2024年贵州毕节职业技术学院招聘60人简章 2024年湖北十堰市郧阳区引进高层次人才16人公告 山东济南国际医学中心管理委员会招聘8人简章 2024年河南永城市消防救援大队招聘专职消防员30人公告 2024年辽宁盘锦市公安局招聘辅警310人公告 2025年江苏南京市建邺区教育局所属学校招聘教师31人公告 广东韶关新丰县丰城街道敬老院招聘护理人员公告 2024年江苏南京市鼓楼区教育局所属学校招聘新教师33人公告 江苏盐城市社会治安综合治理中心(盐城市社会治理指挥中心)选调3人公告 浙江温州永嘉县人和劳动服务有限公司招聘政务服务热线受理员公告 2024年宁夏体育运动训练管理中心招聘优秀运动员12人公告 2024年山西运城市中心医院招聘6人公告 2024年贵州遵义市疾病预防控制中心(遵义市卫生监督所)选调2人公告 2024年黔东南锦屏县人民医院引进急需紧缺人才实施方案 2024年绵阳平武县教育和体育局招聘四川省平武中学教师公告 2024年广州市天河区教育系统校园招聘“优才计划”(北京和西安考点)公告(171人) 2024年台州市立医院招聘放射技术人员公告 2024年郑州大学第五附属医院招聘高层次人才公告