百度公布“新十大发明”,跨模态AIGC、自动驾驶及知识增强大模型等技术上榜|科技前沿

9月21日消息(李文朋)9月20日,百度首次发布“2022十大科技前沿发明”。据数据显示,截至2022年,百度已在人工智能领域发展了十年,累计研发投入超1000亿元,连续四年在AI专利申请量和授权量上保持国内第一。其中,跨模态通用可控AIGC(基于人工智能的内容生成)发明,首次在全球范围内实现语言与视觉大一统的理解与生成;无人车多传感器融合处理系统,也提升百度Robotaxi应对各种城市复杂道路的能力;知识增强大模型鹏城-百度·文心成全球最大中文单体模型,具备了语言理解能力和文学创作的能力等。

AIGC被认为是颠覆现有内容生产方式的新一代技术。在不久前的世界人工智能大会上,百度总裁李彦宏表示,AI作画就是AIGC的一种,它可以以十分之一的成本,千百倍的生产速度,创造出有独特价值和独立视角的内容。而在AIGC的背后则是预训练大模型的发展。百度最早在2019年3月发布了首个开源预训练模型文心ERNIE 1.0。目前已升级成产业级的知识增强大模型家族,涵盖语言大模型、计算机视觉、跨模态、生物计算大模型,以及电力、金融、航天行业大模型等,可从大规模的知识和海量数据中融合学习,具备相应的理解与生成能力。

在自动驾驶领域,百度无人车多传感器融合处理系统的感知技术已在自动驾驶车辆上得到了推广应用,其漏检率总计减少60%,低矮障碍物漏检率减少83%。在活动现场,“基于人工智能的人机交互方法和系统”,荣获第二十二届中国专利金奖,该专利技术主要以深度语义理解为基础,运用知识图谱及深度学习等技术,实现了跨越语言、语音、图像等模态的智能人机交互。此外,“基于弱监督的字符检测器训练方法”荣获第二十三届中国专利银奖,该专利实现了全场景覆盖、超高精度的光学字符检测。

百度CTO王海峰对此表示,百度一方面要在科技前沿领域加紧创新和探索,攻关核心关键技术,把发展主动权掌握在自己手里;另一方面,也要将创新成果与产业融合,促进产业发展,助力高水平科技自立自强。

2022十大科技前沿发明,具体如下:

1.跨模态通用可控AIGC:该发明提出语言与视觉统一的理解与生成模型,创新提出融合知识的生成,实现了文本生成、图像生成、视频生成、数字人生成的实用化跨越。可应用于图文转视频、高精度数字人生成、文生图等创新领域,大幅提升内容生产效率。

2.无人车多传感器融合处理系统:该项发明以多传感器融合为核心,完善激光雷达感知能力,构建了环视视觉的独立闭环能力,已经在自动驾驶车辆上得到大规模应用,实测效果漏检率总计减少60%,低矮障碍物漏检率减少83%。

3.知识增强大模型:该发明是百度文心大模型的核心技术,其从大规模知识和海量数据中融合学习,具备领先的理解和生成能力。包括以全球首个千亿级知识增强大模型鹏城-百度·文心为代表的语言大模型、计算机视觉、跨模态等大模型,以及电力、金融、航天等行业大模型,目前已大规模应用于百度的各类产品,并通过飞桨和百度智能云支持各产业的智能化升级。

4.深度学习通用异构参数服务器架构:该项发明通过可扩展的架构设计,可支持基于CPU、GPU、XPU等不同类型硬件的参数服务器架构单独训练,还可以通过强化学习算法将同一深度学习模型训练任务分配到不同类型硬件的计算节点上进行混合硬件异构训练,从而可减少50%以上的深度学习模型训练成本,提升深度学习模型的训练效率。

5.基于AI的生物计算平台PaddleHelix:该发明提出了一系列基于AI的生物计算创新技术,包括自主研发的mRNA疫苗设计LinearDesign算法,基于几何空间构象的化合物表征模型HelixGEM,端到端的单序列蛋白结构预测模型HelixFold-Single等,可大幅提升新药研发和疫苗设计效率,助力科技抗疫。

6.面向自动驾驶的车路协同关键技术:该项发明构建了车路协同自动驾驶的复杂技术体系与融合协同机制,通过协同感知,解决自动驾驶动静态盲区、超视距、遮挡等一系列感知长尾问题,通过协同决策规划和协同控制解决混行状态下的现实变更、博弈、阻塞和极端场景等问题,降低自动驾驶的接管次数和安全事故风险,保障自动驾驶安全连续运行。

7.全平台量子软硬一体:该发明围绕“量羲”布局,“量羲”是百度推出的基于“乾始”研发的全平台量子软硬一体化解决方案,提供私有化部署、云服务、硬件接入等一系列服务,最大程度上简化量子硬件部署到量子服务的全流程。“量羲”具备适配超导、离子阱等多类型主流量子芯片,可实现量子芯片“即插即用”。

8.数字人智能化生产:该发明基于语音、语义和视觉等AI技术,以智能终端为载体,实现人机可视化语音交互服务。借助百度智能云曦灵平台,打通数字人生产、人设管理、内容创作到业务编排的全流程。结合UNIT7.0跨模态对话引擎及AIGC技术,支持服务型和演艺型数字人多种人像(2D、3D、卡通)高效生产及运营。

9.智慧城市全要素双总线技术:该发明的全要素双总线包含“智慧总线”与“知识总线”,“智慧总线”构建城市服务的全资源协同开发与运行环境,统一纳管调度城市中的各类数据、算法、算力,为智能化应用开发提供综合技术供应;“知识总线”依托文心增强的城市多模态大模型及知识图谱、NLP等AI技术,搭建城市全要素融合知识图谱,支撑跨部门、跨应用、跨数据间的知识体系打通和资源共用。

10.自动驾驶多模态行人运动预测:该发明提出一种融合“多模态输入特征”以及“多维度交互模式”的深度学习模型,用于预测行人未来6s的运动轨迹,已在Robotaxi业务中落地应用,行人预测准召提升30%,VRU碰撞风险问题解决率95%。

热门相关:我有一个变异胃   给偏执大佬投喂一颗糖   她的下半身浸透着强烈的肌肤之亲   给偏执大佬投喂一颗糖   极品全能学生