周鸿�t表示,这次OpeanAI发布的是GPT-4o,最大的惊艳就是它的语音输入和声音输出的整体体验。在过去,我们在处理声音的时候,实际上是用了三个引擎,先是说话后把语音用一个语音识别引擎翻译成文字,然后再把文字交给大模型去处理,然后大模型处理完了再把答案通过一个叫TTS的引擎,把文字转成语音,然后再输出来。
周鸿�t指出,这样做的结果是,体验非常不像真人,比如这三个引擎合起来的时延就特别长,而我们真人说话一句话反应的时延大概在300毫秒左右,但是用三个引擎联合起来,这种做得假的语音响应和语音处理延迟至少在2秒到3秒以上,你就知道他不是真人。
此外,因为分了三个引擎,就会导致人们在说话中的很多的情绪语调等微妙的东西都被丢掉,所以输出语音的时候也自然没有人的情绪,所以很多机器人发音就没有抑扬顿挫,平铺直叙听不出感情。同时,传统语言交互经常需要喊出唤醒词的设计,也会极大地影响交互体验。
“但在有了openai的这种对话能力后,大家以后不会觉得我的分享像个数字人,反而会说老周还不如数字人了。”周鸿�t自我调侃道。(文猛)
责任编辑:尉旖涵

- 随机文章
- 热门文章
- 热评文章
- 微软新专利探索声音AI应用,可预估地震、风暴等自然灾害
- 马棕油期货:地缘政治风险与需求潜力交错,价格何去何从?
- 白银被强烈看涨,黄金看跌情绪加剧
- 中央汇金再次大买3只ETF?买入金额至少近1400亿元
- 和谐共生|解码“地球之肾”,中国湿地何以美出圈?
- 受下游铁水产量回升带动 双焦氛围改善
- 非上市银行的2023年:盈利分化,有的倍增有的“腰斩”
- 瑞银将A股和港股评级上调至“增配” A50指数迎利好
- MH迈汇:黄金作为对冲通胀和违约风险的"好钱"
- 日本前外汇高官:如果日元继续贬值,将会迎来干预
- 超燃!港股尾盘攻势不减,港股互联网ETF(513770)涨近4%!续刷年内新高!
- 中国首颗超500比特超导量子计算芯片正式发布
- 这场技术交易大会干货满满
- 1“赛事+”提升城市“流量” 陕西商洛拓经济发展新“赛道”
- 2“五一”临近 持基过节的投资者要注意这几点
- 3华发股份:成功入选“人民优选”品牌 五一黄金周热销30亿
- 4非常危险!女子摔成粉碎性骨折!又是因为洞洞鞋,夏天多人中招……
- 5钟鼓楼老街区的古都新事
- 6金税四期试点上线,财税体制改革拉开帷幕!或有资金借道信创ETF基金(562030)逢跌进场布局
- 7到2027年产业规模达到2000亿元 浙江发布历史经典产业高质量发展计划
- 8初步数据:我国一季度经常账户顺差392亿美元
- 9“发现山西之美”TDC旅游发现者大会举办:共话文旅新生态 邀客体验新玩法
- 10IDC:24Q1全球PC出货量恢复增长 达到疫情前水平
- 11(中国新貌)“国宝”大熊猫:栖居更美境 云游更广天
- 12培养工程领域专业人才 非洲首所交通大学在尼日利亚投入使用
- 13瑞众保险副总裁俞德本出任公司临时负责人
- 1大裁员下,特斯拉两名顶级高管离职
- 2奇瑞将与欧洲高端品牌签署技术平台授权协议
- 32024中国长三角青年企业家交流大会在杭州举办
- 4雷克萨斯GX中东版 全部在售 2023款 2022款 2020款 2019款 2018款成都远卓名车雷克萨斯GX中东版团购钜惠20万 欢迎上门试驾
- 5零跑C16将搭载中创新航磷酸铁锂电池
- 6Q1净利微增7%,宁德时代股东总数较2023年年末减少10728户
- 7哪吒,需要背水一战
- 8“新”中有“机”!创新服务承接新流量 撬动消费升级
- 9非创始版SU7何时交付 小米:工厂生产爬坡 全力提高产能
- 10央媒评卧铺挂帘:谁买的票谁做主
- 11江西南昌首部“多规合一”国土空间总体规划获批
- 12方程豹旗舰硬派越野!豹8正式亮相:仰望U8“青春版”登场
- 13583家族/造型霸气 方程豹豹8量产版发布



