周鸿�t表示,这次OpeanAI发布的是GPT-4o,最大的惊艳就是它的语音输入和声音输出的整体体验。在过去,我们在处理声音的时候,实际上是用了三个引擎,先是说话后把语音用一个语音识别引擎翻译成文字,然后再把文字交给大模型去处理,然后大模型处理完了再把答案通过一个叫TTS的引擎,把文字转成语音,然后再输出来。
周鸿�t指出,这样做的结果是,体验非常不像真人,比如这三个引擎合起来的时延就特别长,而我们真人说话一句话反应的时延大概在300毫秒左右,但是用三个引擎联合起来,这种做得假的语音响应和语音处理延迟至少在2秒到3秒以上,你就知道他不是真人。
此外,因为分了三个引擎,就会导致人们在说话中的很多的情绪语调等微妙的东西都被丢掉,所以输出语音的时候也自然没有人的情绪,所以很多机器人发音就没有抑扬顿挫,平铺直叙听不出感情。同时,传统语言交互经常需要喊出唤醒词的设计,也会极大地影响交互体验。
“但在有了OpenAI的这种对话能力后,大家以后不会觉得我的分享像个数字人,反而会说老周还不如数字人了。”周鸿�t自我调侃道。(文猛)
责任编辑:尉旖涵

- 随机文章
- 热门文章
- 热评文章
- 北证50指数关注度走高 机构看好北交所投资价值
- 袋鼠云春季发布会圆满落幕,构建Data+AI新质生产力
- 招商蛇口一季度销售金额402亿元,3月斥资11.98亿元获一宗地块权益
- 分手含泪转让演唱会门票?小心有诈!
- 投资者惊呼!这几国要联手干预汇市?后市展望如何?
- 英伟达闪崩,沪深300跑赢纳指,那些人工智能基金怎样了?
- 益佰制药疏肝益阳胶囊入选米内网2023年度壮腰健肾中成药产品TOP10 销售过亿元位列第五大品种
- 交易员:若失守这一点位,金价或跌向2200
- 杭州26岁女子与朋友攀登清凉峰,失联一天一夜!刚刚,最新消息传来
- 险企股权大降温 永诚财险二次转让
- 中央气象台:西北地区有沙尘天气
- 习言道|从一张餐桌,读懂习近平的大食物观
- 以“经济周期弱敏感资产”为支点,浙商银行助力金融强国建设
- 1“赛事+”提升城市“流量” 陕西商洛拓经济发展新“赛道”
- 2“五一”临近 持基过节的投资者要注意这几点
- 3华发股份:成功入选“人民优选”品牌 五一黄金周热销30亿
- 4钟鼓楼老街区的古都新事
- 5到2027年产业规模达到2000亿元 浙江发布历史经典产业高质量发展计划
- 6非常危险!女子摔成粉碎性骨折!又是因为洞洞鞋,夏天多人中招……
- 7金税四期试点上线,财税体制改革拉开帷幕!或有资金借道信创ETF基金(562030)逢跌进场布局
- 8初步数据:我国一季度经常账户顺差392亿美元
- 9IDC:24Q1全球PC出货量恢复增长 达到疫情前水平
- 10“发现山西之美”TDC旅游发现者大会举办:共话文旅新生态 邀客体验新玩法
- 11国门“夫妻档” 国庆共坚守
- 12北交所一周审核动态:2家企业更新进展 胜业电气二轮问询回复中称家电头部客户对价格敏感度较低
- 13(中国新貌)“国宝”大熊猫:栖居更美境 云游更广天
- 1大裁员下,特斯拉两名顶级高管离职
- 2奇瑞将与欧洲高端品牌签署技术平台授权协议
- 32024中国长三角青年企业家交流大会在杭州举办
- 4雷克萨斯GX中东版 全部在售 2023款 2022款 2020款 2019款 2018款成都远卓名车雷克萨斯GX中东版团购钜惠20万 欢迎上门试驾
- 5零跑C16将搭载中创新航磷酸铁锂电池
- 6Q1净利微增7%,宁德时代股东总数较2023年年末减少10728户
- 7哪吒,需要背水一战
- 8“新”中有“机”!创新服务承接新流量 撬动消费升级
- 9非创始版SU7何时交付 小米:工厂生产爬坡 全力提高产能
- 10央媒评卧铺挂帘:谁买的票谁做主
- 11江西南昌首部“多规合一”国土空间总体规划获批
- 12方程豹旗舰硬派越野!豹8正式亮相:仰望U8“青春版”登场
- 13583家族/造型霸气 方程豹豹8量产版发布

![[诉讼]*ST瑞茂(600180):瑞茂通关于公司及子公司新增诉讼及进展情况](https://www.aooyin.com/zb_users/theme/ydblack/include/random/104.jpg)

