环球视角：OpenAI推出声音克隆新技术 15秒音频即可模仿任何说话者

2024-03-30 08:58 由环球网发表于 #科技

【环球网科技综合报道】据外媒消息，在人工智能领域持续创新的OpenAI公司，近日宣布了一项革命性的声音克隆技术——“语音引擎”。该技术作为其现有文本转语音API的扩展，仅需15秒的音频样本，便能模仿任何说话者的声音。

OpenAI表示，这项新技术能够生成“自然的语音”和“情感丰富且真实的声音”。自2022年以来，该技术一直在研发中，并已应用于支持公司当前的文本转语音API和Read Aloud功能中的预设语音。

为了展示这项技术的实力，OpenAI在其官方博客上发布了一系列声音样本，这些样本的逼真程度令人惊叹。公司鼓励公众倾听这些声音，并想象它们在未来可能带来的各种应用场景。

OpenAI认为，这项技术对于阅读辅助、语言翻译以及帮助言语障碍患者具有重大意义。例如，在布朗大学的一个试点项目中，该技术已被用于创建从学校项目录制的音频中提取的语音克隆，以帮助那些患有言语障碍的学生。

然而，OpenAI承认它存在被滥用的风险，特别是在选举年等敏感时期。因此，在全面推出之前，公司必须解决相关的隐私问题和道德挑战。

为此，OpenAI已经与来自政府、媒体、娱乐、教育等多个领域的合作伙伴进行了深入交流，以确保在产品发布时能够将风险降至最低。同时，所有预览测试人员都必须遵守OpenAI的使用政策，该政策明确禁止在未经同意或缺乏合法权利的情况下冒充他人。

此外，OpenAI还实施了一系列安全措施，包括使用水印技术追踪音频来源，以及对系统的使用方式进行主动监控。当产品正式推出时，公司将设立一个“禁止语音列表”，以检测并阻止与名人过于相似的人工智能生成声音。

在宣布这项新技术的同时，OpenAI还透露了与微软的另一项重大合作计划，双方将共同打造一款名为“Stargate”的基于人工智能的超级计算机。据报道，该项目预计将耗资高达1000亿美元。

热门相关：弃妇种田忙勇闯天涯驭房我不止有问心术纣临我的抖音太无敌

相关文章

玩家被黑客盯上，动视暴雪调查针对用户的恶意软件攻击

动视暴雪发言人德莱尼·西蒙斯（Delaney Simmons）在接受TechCrunch采访时表示，公司已意识到“有传言称部分玩家因下载或使用未经授权的软件而遭阅读全文

外媒：苹果新款iPad Pro或5月亮相，搭载M3芯片及全新配件

根据最新发布的财报，华为全年收入同比增长9.63%，达到7042亿元人民币（约合974.8亿美元），消费业务的强劲复苏成为推动增长的主要动力，其贡献的收入增长高阅读全文

环球视角：阿拉斯加机场启用伪装机器人吓跑野生动物保障飞行安全

【环球网科技综合报道】据美联社消息，近日，阿拉斯加交通和公共设施部宣布，在费尔班克斯机场启用一款名为“极光”（Aurora）的先进机器人，以驱赶跑道上的野生动物阅读全文

牵手新媒介，传统戏曲有多少种打开方式

新媒体语境带来了传统戏曲发展的新机遇，戏曲在真善美相统一的价值追求中，更新了创作、欣赏与传播的理念与方式，在带给观众全新体验与艺术享受的同时，也拉近了年轻人与戏阅读全文

河北滦南建设无废城市

不仅是畜禽粪污变废为宝，还有地沟油等废弃油脂转化为生物柴油、粉煤灰加工成陶瓷棉，这些都是滦南县打造“无废城市”的生动案例阅读全文

广东锚定产业科技互促双强

本报北京3月29日讯（记者潘卓然）国新办29日举办“推动高质量发展”系列主题新闻发布会，广东省委副书记、省长王伟中表示，广东将抓住新一轮科技革命和产业变革重大机阅读全文

合力整治微短剧收费乱象

近年来，微短剧迎来井喷式发展，但随之而来的收费乱象也引起热议。在小红书、抖音、微信小程序等多个平台投放的微短剧，已经成为不少网友的“电子榨菜”。然而，一些微短剧阅读全文

苏宁易购发布2023年财报净利润同比大幅减亏74.79%

报告期内苏宁易购坚定贯彻零售服务商发展战略，聚焦核心家电3C业务发展，推进全渠道建设、供应链发展、服务能力提升，在稳健经营中增强发展韧性，家电业务销售规模以11阅读全文

蚂蚁集团与Capital A拓展战略合作，共推数字支付、金融科技和可持续发展

蚂蚁提供的跨境移动支付、国际收单服务等解决方案将携手Capital A旗下亚洲航空、一站式旅行平台AirAsia MOVE和金融应用BigPay等整个商业生态单阅读全文

民航局：限用类中型无人驾驶航空器系统型号合格审定指南将于近期发布

3月29日，民航局推进低空经济发展专题新闻发布会。阅读全文