热门搜索
-
三星Project Moohan与谷歌Android XR平台首秀:多模态交互革新未来人机交互
三星Project Moohan与谷歌Android XR平台首秀:多模态交互革新未来人机交互IT之家12月13日消息,前谷歌产品经理Bilawal Sidhu今日在X平台发布了一则令人振奋的推文,分享了谷歌Android XR平台与三星Project Moohan头显的首个官方现场演示视频。这段长达6分8秒的视频,完整地展现了这款令人期待已久的新型XR头显的强大功能,预示着未来人机交互方式的深刻变革...
手机互联 2024-12-13 15:35:26 -
ChatGPT实时视频处理功能上线:开启AI多模态交互新纪元
ChatGPT实时视频处理功能上线:开启AI多模态交互新纪元12月13日,OpenAI在其备受瞩目的聊天机器人ChatGPT中引入了一项突破性功能:实时视频处理和交互。这一功能的发布,标志着ChatGPT在多模态交互领域的又一重大进展,距离其首次亮相已过去了七个月...
业界动态 2024-12-13 08:27:30 -
小米澎湃OS2“超级小爱”内测开启:多模态交互、主动智能,全面提升用户体验
小米澎湃OS2“超级小爱”内测开启:多模态交互、主动智能,全面提升用户体验除了澎湃OS2正式版面向小米14系列机型推送以外,小米今日还宣布,澎湃OS2“超级小爱”功能首批内测开启推送,首批面向已通过内测招募的用户。覆盖机型包括小米15、小米15 Pro、小米14 Ultra、小米14 Pro 钛金属版(卫星通讯)、小米14 Pro 和小米14...
手机互联 2024-11-09 19:12:51 -
vivo发布蓝心大模型矩阵:全面升级语言、端侧、语音、图像和多模态模型
vivo发布蓝心大模型矩阵:全面升级语言、端侧、语音、图像和多模态模型在今日上午举办的2024 vivo开发者大会开幕演讲上,vivo正式发布了其自研的全新蓝心大模型矩阵,全面升级了语言大模型和端侧大模型能力,并带来了vivo自研的语音大模型、图像大模型以及多模态大模型。与蓝心7B相比,蓝心3B在性能方面取得了显著提升: 极致性能提升300%: 蓝心3B的性能大幅提升,效率更高...
手机互联 2024-10-10 11:28:24 -
联发科Dimensity9400将支持Google GeminiNano,带来多模态人工智能体验
联发科Dimensity9400将支持Google GeminiNano,带来多模态人工智能体验Google在Pixel 9系列中推出了GeminiNano,这是一款搭载在Tensor G4芯片组上的AI芯片,可以让智能手机在设备上执行AI任务,无需通过互联网连接到服务器。GeminiNano可以帮助执行文本生成、音频处理等任务,并且随着时间的推移,它已经发展出多模态功能,这意味着它可以理解文本和图像等多种类型的媒体...
手机互联 2024-10-08 23:40:23 -
智联信通科技取得“基于区块链的跨模态数据联合管理方法”专利
智联信通科技取得“基于区块链的跨模态数据联合管理方法”专利2024年7月31日,据天眼查知识产权信息显示,智联信通科技股份有限公司取得一项名为“基于区块链的跨模态数据联合管理方法”的专利,授权公告号为CN118171236B,申请日期为2024年5月。该专利旨在解决现有技术中跨模态数据管理困难的技术问题,并提出了一套基于区块链的解决方案...
区块链 2024-08-04 10:10:21 -
多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟
新智元报道编辑:好困【新智元导读】最近,来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」,可有效解决MLLM输出幻觉的问题。视觉幻觉是常见于多模态大语言模型(Multimodal Large Language Models, MLLMs)的一个典型问题...
智能设备 2023-10-30 15:01:02 -
精确率提升7.8%!首个多模态开放世界检测大模型MQ-Det登NeurIPS2023
新智元报道编辑:LRS【新智元导读】MQ-Det在已有基于文本查询的检测大模型基础上,加入了视觉示例查询功能,同时保留了高泛化性能和细粒度多模态查询,在ODinW-35基准上实现SOTA性能。目前的开放世界目标检测模型大多遵循文本查询的模式,即利用类别文本描述在目标图像中查询潜在目标,但这种方式往往会面临「广而不精」的问题。论文链接:https://arxiv.org/abs/2305...
智能设备 2023-10-19 02:15:01 -
百度李震宇:大模型将走向多模态,塑造完全自动驾驶的汽车机器人
雷递网 乐天 10月17日百度创始人、董事长兼首席执行官李彦宏昨日在百度世界大会上表示:“未来的AI原生应用一定是多模态的,在信息世界之外,一定会重构物理世界,自动驾驶就是视觉大模型重构物理世界的一个典型应用。大模型会让百度的自动驾驶能力超越经验系统,更聪明地处理复杂场景,实现更广泛的时空覆盖。”在当天下午的百度世界大会2023“大模型‘重构’智能汽车”论坛上,百度集团资深副总裁、智能驾驶事业群组总裁李震宇表示:大模型的“智能涌现”带来理解、生成、推理、记忆等核心能力的突破,让汽车具有EQ和IQ,将重构智能汽车业态。未来的大模型还将走向多模态,塑造出完全自动驾驶的汽车机器人。萝卜快跑将越来越接近商业化盈利在智舱方面,语言大模型的上车,让人和车交互方式会从“命令式”升级到“对话式”,推动人车关系升级为人和虚拟人的关系。大模型将重构人车交互方式,让交互更加自然。以文心大模型为基础,百度Apollo为汽车座舱打造了专属大模型技术底座。人和车的交互不再需要复杂的按键操作,用语音就能操控,即便是七嘴八舌、多人指令、声音交织、连续对话的情况下,智能座舱也能理解每个人不同的需求,同时满足。目前,百度Apollo智舱大模型加持的产品将在极越01、凯迪拉克、别克、吉利银河等品牌车型中实现量产搭载。在智驾方面,通过Transformer和BEV等新技术彻底重构自动驾驶技术栈,感知能力获得代际感提升,加速纯视觉方案的成熟和普及。百度称,百度Apollo纯视觉高阶智驾方案可应用于高速、城市、泊车等全域场景,将在今年第四季度实现量产,这是国内首个纯视觉方案在城市场景落地。去掉激光雷达让整车成本更低,提升了市场竞争力。大模型还将走向多模态,重构物理世界,自动驾驶就是大模型重构物理世界的一个典型代表。大模型让自动驾驶超越经验系统,更聪明地处理复杂场景,实现更广泛的时空覆盖,塑造出完全自动驾驶的汽车机器人。百度称,百度自动驾驶出行服务平台萝卜快跑,已经是全球最大的自动驾驶出行服务商,累计提供了超过400万次服务。随着运营规模的不断扩大、技术水平的不断提升,成本更低的自动驾驶车辆的规模化部署,萝卜快跑将越来越接近商业化盈利。李震宇表示,百度在人工智能、深度学习等领域投入超过十年,在智能汽车领域也探索了十年,十年日拱一卒的技术积累、实践是百度Apollo信心和底气的来源。大模型让全无人自动驾驶真正落地,汽车智能化的浪潮也将快速到来。大模型“重构”智能汽车的三条关键路径近年来,智能驾驶在用户整体购车因素的占比快速上升,在“选购前最重视因素”占比从1.2%突破到30%,成为用户购车核心决策因素。智能汽车市场正处在规模化量产前夕,智能汽车底层智能化技术也在发生重构,让AI原生出行时代更快到来。李震宇认为,大模型对智能汽车行业的重构主要体现在三个方面。语言大模型上车,人车交互方式会从“命令式”升级到“对话式”;通过Transformer和BEV等新技术彻底重构自动驾驶技术栈,感知能力获得代际感提升,加速纯视觉方案的成熟和普及;未来的大模型还将走向多模态,塑造出完全自动驾驶的汽车机器人。会上还发布了多款智驾和舱驾融合产品。百度Apollo量产的Apollo Highway Driving Pro进一步演进,发布了新一代Apollo City Driving,使得使用场景从封闭道路升级到城市开放道路,功能场景无限接近全域。百度称,纯视觉城市领航高阶智驾产品Apollo City Driving Max将于2023年第四季度量产落地。与此同时,百度Apollo还行业首发了Apollo Robo-Cabin舱驾一体软芯融合智算平台,它是中国首个能够完成甚至是全球首个真正意义上在单SOC上实现了舱驾融合运行的平台。活动现场,百度Apollo与航盛签署战略合作,宣布将共同基于高通平台打造新一代舱驾融合产品。雷递由媒体人雷建平创办,若转载请写明来源。 ...
智能设备 2023-10-19 02:14:57 -
智谱AI开源多模态大模型并官宣即将发布新一代大模型产品
【网易科技10月17日报道】近期,智谱AI和清华KEG合作研发并开源了名为CogVLM-17B的多模态大模型,同样可以回答各种类型的视觉问题,可以在不牺牲任何 NLP 任务性能的情况下,实现视觉语言特征的深度融合。记者获悉,在多模态权威学术榜单上,目前CogVLM-17B是综合成绩第一的模型,在14个数据集中的10项权威跨模态基准上取得了SOTA性能,其余4项取得了第二名的成绩...
智能设备 2023-10-19 02:14:45 -
对话360孙浩:多模态大模型+物联网将是新风口
【网易科技6月5日报道】近日,360智慧生活推出360智脑·视觉大模型及360户外球机6 Pro等多款AI硬件新品,并宣布360智慧生活正式进军SMB(中小微企业)市场,实现从家庭场景到企业商用的全覆盖。在AI的落地应用上,360智慧生活已经探索多年,如今为何将视线放在了SMB市场?未来又将如何发展?针对这些话题,网易科技与360视觉云业务线总经理孙浩展开了深入交流...
智能设备 2023-06-05 10:25:26 -
360发布视觉大模型周鸿祎:多模态大模型与物联网结合是新风口
【网易科技5月31日报道】“原来的AIoT只是垂直AI,不是通用AI,经过大模型赋能的AIoT才是‘真AI’”,5月31日,三六零(601360.SH,下称“360”)智慧生活集团举办视觉大模型及AI硬件新品发布会,360集团创始人周鸿祎参会并发表演讲——大模型开启AIoT新时代。会上,周鸿祎宣布发布“360智脑-视觉大模型”。他表示,大语言模型是构建视觉大模型的基础,多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。同时,视觉大模型也是“360智脑”的重要能力组成,让“360智脑“能够看懂图片,未来还能看懂视频、听懂声音。周鸿祎表示,过去的人工智能是弱人工智能,在此基础上打造的智能硬件不具有真正的智能。大模型出现后,计算机第一次真正的理解这个世界,并能够赋予AIoT真正的智能。他表示,大模型的出现标志着通用人工智能到来,AI完成了从感知层到认知层的进化。“大模型将带来一场新工业革命”,周鸿祎认为,所有软件、APP、网站,所有行业都值得用大模型进行重塑,而智能硬件是硬件化的APP。从大模型的发展趋势来看,多模态是大模型发展的必经之路,GPT-4最重要的变化是拥有了多模态的处理能力。因此,周鸿祎预言,多模态大模型与物联网的结合将会成为下一个风口。他表示,多模态技术与智能硬件结合是大势所趋,未来大模型将成为物联网的大脑,物联网设备则相当于大模型的感知端,让大模型进化出“眼睛和耳朵”,大模型还有可能操控物联网设备,进化出嘴巴、手和脚,从而拥有行动力,最终实现从感知到认知,从理解到执行。据悉,360在视觉感知能力基础上,融合千亿参数“360智脑”大模型,基于十亿级互联网图文数据进行清洗训练,并针对安防场景百万级行业数据进行微调,最终打造出了专业的视觉及多模态大模型——360智脑-视觉大模型。“目前,大模型的能力主要体现在软件层,当大模型接入智能硬件,会让大模型的能力从数字世界走向物理世界。”周鸿祎说。(袁宁) ...
智能设备 2023-05-31 21:02:01