过早客
  • 首页
  • 节点
  • 成员
  • 广告投放
  • 登录
  • 注册

现在语音识别的效率已经远高于打字了

硬件数码 • theone • 发表于 5 月前 • 最后回复来自 gccg12000 • 5 月前

我这个帖子就是用语音发的

加入收藏 新浪微博 分享到微信 ❤赞 1698 次点击 0 人赞 3 人收藏

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

共收到17条回复
Mirage 5 月前 湖北省 #1 赞 0

ai现在生成会议纪要已经比人强了

Risawa 5 月前 湖北省 #2 赞 0

语音转文字应该难度比不上文字转语音吧?

想到以前百度地图录个语音包总觉得放出来声音怪怪的不像本人,不知道现在文字转语音的效果如何?

如果这能把本人说话语音语调甚至语气都给模仿到位了,是不是去世的人都能对话了,细思恐极

xzcprint 5 月前 湖北省 #3 赞 1

对于我这种普通话不好的,识别错误率还是挺高的

BusyFox 5 月前 湖北省 #4 赞 0

@Risawa 不用如果,早就做到了。
不光声音克隆,视频图像也能给你生成,对着镜头说“12345,54321....”,输入你要的文案文本和你自己的声音克隆,以假乱真。

Risawa 5 月前 湖北省 #5 赞 0

@BusyFox 真能做到以假乱真的地步?联想到很多视频诈骗是不是就是用了这技术?

wangxixi522 5 月前 湖北省 #6 赞 0

是啊,用了一两年了

yujia_yd 5 月前 湖北省 #7 赞 0

@Risawa B站和抖音教英语的,很多这样的视频,用的名人讲话,说中文和英文对比,似真似假,分辨下还是可以看出是AI合成的

cartoon_author 5 月前 湖北省 #8 赞 0

几乎能做到以假乱真的程度;

但是仔细听的话还是能区分出来,主要是在断句,长句转折的时候,AI生成的语音有很明显的“裂痕”,另外就是多音字错读也还是比较频繁;

jingqui123 5 月前 湖北省 #9 赞 0

社区能发语音就有意思了

irving2016 5 月前 湖北省 #10 赞 1

@Risawa 文字转语音业内叫做TTS。我玩过大部分开源的TTS开源包,效果比较好的推荐GPT-SoVITS(github开源)。给出一份几分钟长的语音样本,可以完美克隆该语音的声线。输入任意文字,都可以用该声线的语音读出来。我试过克隆罗翔,小杨哥的声音,声线效果几乎可以以假乱真。只有一个硬伤,不能控制语音的情感以及情绪波动(悲伤,兴奋),以及不支持方言。

Risawa 5 月前 湖北省 #11 赞 0

@irving2016 有意思,看来以后要想跟AI差异化竞争的话只能从情绪情感上入手了,想到扎克伯格总是被人嘲讽为机器人好好笑

irving2016 5 月前 湖北省 #12 赞 0

@Risawa 今年开始看到,其实商用的TTS可以支持情感了,说明技术是能做到的。但是商用的TTS工具克隆声音,管控得严,大多只支持克隆自己本人的声音,也是怕人乱用,触到法律底线。

Kraft 5 月前 北京市 #13 赞 1

公共场合直接把聊天的内容说出来会不会很尴尬?

fuz 5 月前 湖北省 #14 赞 0

mark

letiankaimen 5 月前 湖北省 #15 赞 0

沙雕动画的配音基本都是AI

asaiaaaa 5 月前 湖北省 #16 赞 0

那以后模仿领导的声音给你打电话,转账汇款。。。。。可怕

gccg12000 5 月前 上海市 #17 赞 0

所以,科技都是双刃剑

请绑定手机号后,再发言,点击此处
Guozaoke.com—源自武汉的高端交流分享社区
相关主题
密码指纹锁推荐
有没有什么好的8k vr设备?
李跳跳有干净的新版本吗?
Android手机推荐
联通网限上传10M了~
为什么手机没有把投影仪这个市场给兼并了呢?
618打算攒一套mac mini,有没有入手过的童鞋,说说体验
预算3000内,蹭619的活动,买一台75寸的电视,有没有推荐的
想买个平板,日常工作和娱乐使用,预算3000,有啥推荐码
装修客厅装风管机,买什么品牌,有没有铁子有使用之后推荐的

过早客微信公众号:guozaoke • 过早客新浪微博:@过早客 • 广告投放合作微信:fullygroup50 鄂ICP备2021016276号-2 • 鄂公网安备42018502001446号