ios 开发 讯飞语音听写的集成集成,怎样解决没有语音主动停止识别的问题

讯飞语音云控件在iOS快速集成经验分享
发表于 11:16|
作者徐玲玲
摘要:CMDN Club第十五期活动已于3月15日顺利举行,本次活动以“移动平台语音技术的应用与实践”主题,以语音技术开发为焦点,从语音基础服务、语音产品开发、语音技术实现等多个维度,探索语音产品创新和技术实践的热点话题。我们邀请了讯飞iOS平台资深开发工程师储双双,与大家分享语音云平台和iOS平台...
Club第十五期活动已于3月15日顺利举行,本次活动以&移动平台语音技术的应用与实践&主题,以语音技术开发为焦点,从语音基础服务、语音产品开发、 语音技术实现等多个维度,探索语音产品创新和技术实践的热点话题。我们邀请了讯飞iOS平台资深开发工程师储双双,与大家分享语音云平台和iOS平台下集成讯飞语音云控件经验。
图:讯飞iOS平台资深开发工程师储双双在做演讲
以下是文字实录:
储双双:我演讲的主题是讯飞语音云控件在iOS快速集成经验分享。首先,自我介绍一下,我叫储双双,参与过讯飞口讯输入法的开发。对于本次演讲主题分三个章节来讲,一个是语音云控件一个介绍,介绍语音云控件是什么样东西,给开发者带来什么好处,它之间一个内部架构给大家分享一下;第二个就是语音云控件的集成流程;最后一个就是跟大家分享一下我集成一些常见问题,也是我遇到的问题,所以跟大家一起分享一下。
在介绍语音云控件之前,先讲一下语音云控件两个成功案例,一个是讯飞口讯,不知道大家有多少了解到讯飞口讯。这个我要提一下,讯飞口讯是去年5月份上了一批STORE,待了五天。其实这款讯飞口讯的产品功能比较简单。就是可以把我的文字通过发短信、发邮件、分享到新浪微博、腾讯微博。刚才在提问的时候大家说语音的应用里面没有提到讯飞输入法有一点小小的失望,讯飞输入法是集语音、手写、拼音、笔画为一体的中文输入法,这就是中文输入法功能最强大一块的输入法。我这里面放了一下它的地址,大家如果感兴趣可以到这个地址访问下载试用一下,也可以给我们产品提一些意见。
我这里面举了一个讯飞口讯和讯飞输入法的工作,其实还有很多的应用,像微博、新浪微博等等都有。
语音云控件简单介绍:这里面其实他目的就是为了让大家更加方便快捷使用语音识别和快速服务。第二个就是对语音API接口进行了二次封装,这样的话用户根本不需要关注这一块东西,也不要有太多的知识背景,只要拿起来用就可以了。我后面会讲这样怎么用,我们把这边封装起来以后,这样可以节省开发的精力,提高开发的效率。
语音云控件给开发者带来什么?一个是免费的,可以免费使用。第二个是它人我们应用交互更加便捷,因为有了云的交互,可以给我们交互更加方便。可以给自己应用里面增加一些亮点,最后一个就是讯飞提供全程免费的技术支持,其实你到我们开发者网站去看,每一个开发者提出的问题,我们都会及时地、全程的给他回复,直到他解决。
开发架构:蓝色部分就是我们MSC空间,它集成我们一个应用里面去,可以作为插件的方式进入我们应用,原来他应用的一个原始架构根本不用做调整,就是很方便的集成到里面去,他自己去负责跟语音云进行一个交互。然后我们来看一下他内部是怎么实现的,这里面左下面是一个MSSP,这个里面用到了技术。然后还有录音、还有播放,这边有一个空间模型,上面是一个UI,下面就是四大技术在这里面。
这里面有四大技术,有降噪、VAD端点检测,音频Speex编解码、语音云协议栈,音频处理是流式录音,流式放音,还有截面层,空间逻辑层。
语音云控件SDK包括开放文档,我们也为大家考虑了,把合成和识别打包了,大家可以直接拿过来用。
特别是API设计友好,使用起来非常方便,其实你用十行或者二十行代码就可以使用到讯飞的语音合成和识别服务,帮助文档非常清晰,每一个接口和参数都有详细的描述。
语音云控件集成流程:第一部是开发者帐号,这就是刚才问大家的一个问题,语音云开发者的网址,就是。我们新建一个iOS工程,导入一个识别,导入系统,然后编写代码,然后编译、运行,这六步骤做完了以后,我们就可以使用到了讯飞的语音合成和识别服务。
我在讲识别控件的代码之前,简单过一下API,这里面有一个创建对象,就是一个旗帜坐标,这里面就是你要传一个参数,刚才APPID可以传进去,还有一些密码可以传进去。第二个就是设置识别引擎,我这个引擎有六种,一个是文本转写,然后是迷你词识别,还有音乐搜索,还有迷你词识别,引擎参数暂时没有用到,这里面GRAMMAR ID这个在迷你词识别会用到。不知道大家对迷你词识别了解吗?
是这样的,如果我们手机通讯录上有很多人名,但是这个人名在识别的过程中,其实识别的效果也不太好,所以我们会把所有的名字如果上传服务器上,在一个小的集成商进行识别,你的识别效果非常好。这在一些电话或者通讯应用里面会用到。
设置录音的采样率,这个里面有8开和16开,我们这里面默认是16开,当然你考虑到流量这些东西8开也是可以的。
下面不用说了,开始识别和取消识别,特别提一下获取上传和下载流量,这个团队挺为大家着想的,把这个上传和流量提出来。其实绝大部分用不到。
识别控件回调API:这里面有两个回调,一个是有识别接口回来的时候,假如像文本接口我们会在这个参数里面给大家,识别结束的时候会有这个参数给大家,这样你应用在什么时候识别,识别结果是什么样,识别结束了你都可以知道。
我们看一下集成的一个代码。我们从49行开始看,看空间初始化,还有空间的一个起始坐标,设置识别类型是一个文本转写然后再设置它的一个回调集合,我们写了一个小的按钮进行一个单击开始一次识别,这样就这样回来了,其实这样十几行代码就可以用到识别的一个服务。
合成:合成也有创建对象,也有初始化,传的参数也是一样的,设置合成的文本,这里面第一个参数是文本,第二个参数暂时用不到,后面会扩展用,这里面合成设置参数稍微多一点,就是考虑到大家平常在合成的时候用到一些东西,所以我们这边有一些设置,设置背景音、设置发音人、设置合成语速,设置合成音量,还有上传和下载流量。
我们看一下合成控件的一个集成。我们从52行开始看,其实我不说,大家都很清楚,实际上就这十几行代码,这一代文本就可以给你合成出来,可以给你播出来。
然后我再讲一下我们在集成一些常见问题的分享。这里面列了几个问题,第一个编译报错,这个如果有经验开发工程师一看就知道了。还有就是程序编译不过去,这个Xcode版本要达到4.2以上。还有就是暂时不支持Apple。
还有合成界面是否可以关闭,是可以的。合成进度是否有回调?暂时没有回调,只有合成完成的回调。一次合成文本是4K,界面是否支持定制,暂时没有支持。五
集成有问题可以咨询我们技术人员,可以到论坛上提问题,他可能需要这样的信息,你错过场景描述、错误码、控制台日志、截图、源码,如果这个提供的全的话可以更好的解决。
我就讲到这里,谢谢大家!
推荐阅读相关主题:
网友评论有(0)
CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
相关热门文章热的完全不想动。
最近流出的 HomePod 固件真的可以说是一个大宝库,各种各样的新产品信息就从其中被发...
二手手机市场鱼龙混杂,我们在此提醒大家,不管作为卖家还是买家都要在手机交易过程中...
这次真的应了那句话:苹果是最大的泄密者。
多样化才是苹果公司未来发展的方向。
希望今年苹果可以顺利在Apple Watch中整合LTE。
苹果还是选择自己设计与新园区风格更为贴合的硬件。
从目前的各种爆料来看,越来越期待iPhone 8的Face ID了。
《Neo Angle》是 Dropout Games 推出的一款益智类游戏,相较于Dropout Games之前推出...
与前作相比有了进一步提升,但依然难掩其中规中矩的质量。
曾经开发过多款像素风格游戏的独立游戏开发者 Brad Erkkila 在本周的 App Store 更新...
此时整个世界已经被大海所淹没,一位可爱的少女只有一艘简易的小木筏以及一根简单的钓...
《Bacon May Die》是一款好玩刺激的动作游戏,玩家在游戏中要操控小猪不断消灭袭来的...
国内团队打造的独立手游新作《影子里的我》,画面唯美,音乐动听,主题治愈,关卡设计...
在本周的 App Store 更新当中,独立游戏开发团队 Daylight Studios 为我们带来了一款...
许多人认为 iPad Pro 的配件 Apple Pencil 没多大用处,或者将它定位为绘画工具,其实...
一直以来,微软的鼠标、键盘和其他配件都有不错的口碑。
Red Raven 摄像机具备 4K 视频拍摄能力,可实现 120fps 每秒传输帧数。
这也是该公司首次带来可为笔记本电脑提供即时电源的移动电源设备。
BookBook 一直都是最受欢迎的 MacBook 保护壳之一。
买表带的同时还为慈善做一些贡献~还不错~
这个是全新的配色,看起来相当的萌,绝对会是妹纸的最爱。
给Apple Watch选购一款保护壳,能让它避免一些磨损。
【听书神器】讯飞语音电子书,完美地在IOS上复活了!真正讯飞的离线语音合成引擎!说书
注册时间 最后登录
在线时间4961 小时 UID
主题帖子人气
白金苹果, 积分 4570, 距离下一级还需 1430 积分
首先,我是一个深度的语音合成引擎朗读书刊文章(俗称听书)的深度爱好者,自从2007年3月到现在,已经听书6年半了,听了最少2000本书了。这些年换了N个手机,每个手机我的必备需求就是要求能装讯飞语音电子书或者替代软件。
& && &在S60v2系统和PPC系统和SP系统,都是有安徽科大讯飞官方开发的“讯飞语音电子书”。
& && &在S60v3系统上,有“听网3.0”也是采用讯飞的引擎,也可以完美听书,并且支持耳机线控操作暂停和继续播放,十分方便。
& && &在安卓系统上,也有无数个讯飞的引擎语音读书的软件。
& && &在IOS系统上,2012年以前一直没有出来一个很好的语音合成软件,无法实现我听书的需求。直到2012年,豆丁公司开发出来了“开放阅读器”,现已改名“豆丁阅读器”了。于是我兴奋地安装测试,使用了十分钟,便在论坛发了一个激情澎湃的推荐帖子 全贴1600字图文并茂! & & 发表于
& && &日到2013年7月,我使用了一整年的豆丁阅读器来听书,听了数百本,因为我工作的性质,我要经常在外面跑,所以我就戴着耳机边走路边听书,一年来也停了数百本书,尤其是那些不需要精读的文章,听的感觉比直接看还要好很多。
& && &2013年7月,我无聊在Appstore里面搜索“听书”关键词,惊喜的竟然发现了除了豆丁阅读器之外第二个语音合成软件,下载,安装,让我惊喜的是,竟然用的是讯飞的官方引擎!!!!!也就是朗读效果与我送了4年多的诺基亚《讯飞语音电子书》《听网3.0》的朗读效果完全一样!!!!太让我惊喜了!
& && &有些软件,是求着你来用它,而有些软件,是你要求着开发者给你开发!而这个软件,就是后者!我曾经在讯飞和听网网站请求开发IOS版,但是一直石沉大海!现在安徽科大讯飞生意做大了,看不上手机APP小软件了,并且重心也转移到语音云上面去了。所以,一个“采用讯飞官方语音合成引擎开发的功能强大的IOS听书软件”这个需求已经在我心目中期盼了3,4年了!到了这一刻,才真正实现了!
& && &这个软件,我已经使用了1个月有余,感觉到确实比豆丁阅读器要好不少,所以决定在论坛发一个详细的评测帖子,也算载入史册了,记录这个历史上第一个IOS的科大讯飞的离线语音合成引擎的读书软件!!!
& && &我们自己有一个听书爱好者的群,一般来说喜欢听书的同志们年龄稍微大一点,可能你们年轻人们更喜欢真人朗读的吧。反正真人朗读我是听不下去的,因为太慢了,我要求的语速最少是二倍速正常说话的速度。并且我要求朗读任意的TXT文档。我一般在下载txt文章,用了N多年,十分多资源。
& && &好吧,正式开始评测!
& && &软件名称叫《说书-离线TTS,朗读文本电子书,课本教程,名著小说,后台播放,线控操作》,我表示汗颜!名字没起好,搜索“说书”也出不来,搜索“离线TTS才能找到”。我联系了作者,建议他改个大气的名字,便于搜索。软件的下载链接在
& && &&&详细评测如下:
& && &1:程序的界面,整体UI,看起来像一个WM8风格的程序,看起来很简单,甚至可以说有点简陋。但是也有一个好处,软件十分轻量级,这一点在下面内存占用环节会有体现。
& && &2:进去程序之后的主界面竟然叫“最近阅读”,有点不知所措,翻来覆去找不到“书库”在哪。呵呵,于是我就连着itunes,导入几本书籍看看。原来所有的书籍都存在“最近阅读”里面,滚动到最下面,可以打开全部书籍列表,大家自己摸索吧。我觉得大方格看起来不直观,列表看起来更直观,我给坐着发了邮件希望能够调整一下。
& && &3:随便点击一本书籍,进去了播放界面,,直接点击屏幕就可以开始朗读了,默认的朗读速度非常慢,但是我一听,就知道是讯飞的引擎了,太熟悉了!!!!!屏幕往右边一拉,左边就出来了控制界面,可以调整语速,我喜欢把语速调到最快。这样舒服多了!新手们建议调到中间,与正常语速接近就好了。
& && &4:内存占用,我懒得安装检测内存的软件,所以我就说说主观感受,用豆丁阅读器的这一年,4S内存不足经常会在后台自动结束掉程序,当然,是在没有播放的时候,播放的时候是不会结束程序的,系统的优先级会最高。iPhone5的豆丁阅读器表现要比4s好,程序要开了很多的时候才会去结束没有播放的豆丁阅读器,每次结束程序的时候没有保存当前朗读的进度,十分不爽。以上是豆丁阅读器的情况。但是这个“说书”软件,程序就感觉比豆丁要轻量多了,内存占用也很少,放在后台,没有播放的时候,可以保存很久都不会被结束,当然,程序开多了之后还是会结束的。我的感觉就是程序的打开和运行非常迅速,很清凉。所以做得很好!这个作者我佩服!
& && &5:语音合成的效果,感觉与S60v3我一直在用的听网3.0的引擎一模一样,我可以接受,比豆丁阅读器使用的中科院(好像是,但是可以可定不是讯飞,只是接近于讯飞)的中文引擎要好多了。豆丁的引擎其实也可以接受的,但是就怕对比,一对比这个“说书”,差距就立马产生了。豆丁的发音和断句都没有讯飞的自然,并且音量也很小,而说书这个的讯飞引擎,声音又大,朗读又自然,普通话发音又标准。所以如果豆丁阅读器是60分的话,那这个说书就是90分。因为后者是站在巨人的肩膀上,哈哈,全世界最好的中文语音合成引擎呀!!!!安徽科大讯飞的中文引擎广泛应用于医院,机场,银行等场合,大家通常听到的排队叫号的都是讯飞的语音合成。当然,朗读小说的话,比排队叫号的那个语音效果要好多了。基本上跟真人朗读的效果很接近了!
& && && &&&这里插播一句,这个软件属于小众软件,真正爱好听书的人,慢慢的就懒得看书了的,我甚至都想买个汉王文本王扫描仪,把我家的实体书全部扫描并且ORC识别成文字txtx版本让我能在手机上听书。说说心态吧,我不要求真人那样声情并茂的给我朗读,我只要求一点,那就是“文字句子段落能清晰地通过耳朵输入我的大脑”,这一点,我已经炉火纯青了!我能听最高语速,我还能判断句子中它念错的字,还有多音字错误的发音!我甚至能给TXT编辑者们纠错。所以,文字通过语音输入大脑,这个步骤,我能轻易地在手机上通过这个软件来实现,那么,这个软件对我就是有意义的!
& && && &&&很多人见到语音合成机嗤之以鼻,他们会下载那些真人朗读的有声小说,我从来不听那个的,对了,在2006年的时候,我听过一整部某某中年播音员朗读的《平凡的世界MP3大全》,后来07年3月出了讯飞语音电子书,我就再也不听真人朗读的了,因为语音合成可以朗读任意的txt文档,这就灵活太多了!到目前为止,除了文言文、诗歌、英文,以外,其它的小说,帖子整理的文章,励志的书籍等等,我听了不下2000本。语音合成可以调整语速来节约时间。听书可以在走路的时候,洗澡的时候,坐车的时候听,十分惬意!
& && && &&&总的来说,这是小众圈子的软件,喜欢的爱得不得了,不喜欢的看都不会看。
& && & 6:线控功能,十分强大的线控功能!!!!!!比豆丁阅读器要强大多了。豆丁只能控制暂停和继续,而这个说书,可以控制快进,快退,暂停,继续,下一章节,上一章节,就如同你播放歌曲那样操作!这个作者看来是一个细节控!实用派的人士!这个线控十分的稳定,比如你暂停了,然后玩游戏,然后运行了很多个程序,这时你想听书,只需要按个耳机键,就会继续播放,十分惬意!感谢作者考虑的这么周全!!!!!
& && & 7:竟然支持锁屏界面的屏幕快捷按钮!IOS6和IOS7都可以,会显示播放音乐的按钮,可以完全控制!锁屏的时候也能控制!
& && & 8:本软件没有在线书城,需要手动连数据线连电脑用itunes导入书籍,可以用itunes和itools或者任意助手!本软件也没有WIFI传输的功能,这一点确实有点不方便,但是,为了听书,最主要的还是在于听,既然开发者是一个人在战斗,那我就只能说,你小子可以呀!做到这般地步简直就是我们听书爱好者们的救世主!!!!!
& && & 9:作者回复我说,下一个版本会加入一个牛B的功能,就是一句一保存!这样以后,哪怕程序崩溃,也能再次打开就能定位于上次播放的进度!!!!!!牛B了!!!!目前的版本还只能崩溃后停留于上次保存的进度,期待下周的更新。
& && & 10:作者还说他正在加入RSS订阅朗读,还有网上追书的功能!虽然我用不上,但是看他怎么做了,做得好的话,用户体验好的话,那就牛B了!
& && & 11:作者加入了一个彩蛋,免费让大家用上收费的全部功能!!!!!!方法如下:(请务必按照准确步骤来操作)
& && && && &&&(1)进入主界面,滑动到最左边,关于“说书”
& && && && &&&(2)点击那个最大的图标6次,一次一次的点,点6下即可,会弹出来一个“说书亲友团”,点绿色按钮“sign up”,然后输入个中文用户名和密码,还有邮箱,点绿色按钮,注册成功,然后返回到登陆界面,输入你注册的中文名称和密码,绿色按钮,登陆成功!先别退出程序!!!!!
& && && && &&&(3)把界面拉到右边的“应用设置”界面,更换一个颜色配色,换成绿色。换好之后就可以完美的使用全功能版的听书软件了!!!!!这是作者告诉我的哈哈!省去了你的16元钱!
& && & PS:最后我要说,IOS上的讯飞引擎的电子书朗读软件,我估计不会再有后来人了,所以我很珍惜这个软件!希望能直接与开发者即时沟通,反馈一下我的建议,让这个软件更加完美!
& && && && && &有的软件轻于鸿毛,有的软件重于泰山!!!在2008年的时候,我在论坛发表了《等着一个软件,完美了我就换N82!它就是“听网”!》h (全文2000字左右)当时我的心情就是宁可出资1000元捐款,向科大讯飞官方请求做一个讯飞语音电子书的S60V3系统的版本。讯飞的回复是不作考虑。再后来,2008年底,听网3.0就出来了!完美了!于是S60v3手机成了我必备手机。
& && && && && &再到后来,我给听网官方提了很多建议,在日,我发表了这个帖子《听网后续的完美开发计划!太完美了!语音朗读小说的王者!》, 这是一篇10000多字的帖子!里面有我给听网官方人员的后续开发建议!还有官方人员回复我的信息。
& && && && && &所以,能在IOS上用到如此完美的讯飞引擎的听书软件!我真的十分十分十分地感动!iPhone在我心中才真正变得完美起来!!!!!喜欢听书的都可以理解我的。大家珍惜这个软件吧!如果要去评价的话,建议给好评给作者激励他后期继续开发!
启动软件之后,进入了第一屏,可以发现作者是一个文艺青年。
下面界面是进去之后的左右滑动的几个界面!
<p id="rate_3426" onmouseover="showTip(this)" tip="&a
href=&forum.php?mod=redirect&goto=findpost&ptid=6945777&pid=&fromuid=1&&&span &精品文章^_^,试用看看&/span&&/a&&人气 + 1
" class="mtn mbn">
注册时间 最后登录
在线时间373 小时 UID
主题帖子人气
淘宝搜索店铺“龙信百
找这款软件好久啦。&&之前用听网听书超级喜欢。后来换iphone就没有这种软件啦现在出来了有可以过听啦。&&爽呀
注册时间 最后登录
在线时间0 小时 UID
主题帖子人气
lz我是第一次用这种软件.如果可以能告诉下我怎么导入书籍吗.qq
注册时间 最后登录
在线时间226 小时 UID
主题帖子人气
对蛇狸于 23:28:18在楼主发表的内容评分:人气:+1;
首先,我是一个深度的语音合成引擎朗读书刊文章(俗称听书)的深度爱好者,自从2007年3月到现在,已经听书6年半了,听了最少2000本书了。这些年换了N个手机,每个手机我的必备需求就是要求能装讯飞语音电子书或者替代软件。
& && &在S60v2系统和P……精品文章^_^,试用看看
注册时间 最后登录
在线时间394 小时 UID
主题帖子人气
提示: 作者被禁止或删除 内容自动屏蔽
注册时间 最后登录
在线时间516 小时 UID
主题帖子人气
我是女生啦,- - 我不是扣脚大汉
已经下载了,直接可以从别的地方打开文档哦,不必用电脑传,看了内容简介说的是可以从别的地方打开文档,我一般用百度云下载资源然后用对应软件打开,刚好可以用百度云下载或者网页下载然后打开方式选择听书就可以了!应该已经安装好了!如果好用的话我就给好评然后说是楼主吐血推荐的
注册时间 最后登录
在线时间4961 小时 UID
主题帖子人气
呵呵,你是高手!回5楼温柔女友于2 分钟前发表的: 已经下载了,直接可以从别的地方打开文档哦,不必用电脑传,看了内容简介说的是可以从别的地方打开文档,我一般用百度云下载资源然后用对应软件打开,刚好可以用百度云下载或者......
注册时间 最后登录
在线时间1121 小时 UID
主题帖子人气
书导在哪个文件夹里啊?都试过来,没有啊。
注册时间 最后登录
在线时间583 小时 UID
主题帖子人气
的确好用哈
No matter the ending is Perfect or not,you cannot disappear from my world。
注册时间 最后登录
在线时间127 小时 UID
主题帖子人气
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖
回帖后跳转到最后一页
威锋旗下产品
Hi~我是威威!
沪公网安备 29号 | 沪ICP备号-1
新三板上市公司威锋科技(836555)
增值电信业务经营许可证:
Powered by Discuz!视频太卡?试试切换线路
本课时讲解人机交互演变史:从键盘到多点触摸再到语音交互、科大讯飞语音服务的优势和提供的各项服务、讲述语音服务的接入现状。
本节主要介绍语音云开放平台,以及开放平台提供的各种服务,包括语音基础能力类的合成、识别、唤醒,语音定制服务类的开放语义,模式识别类的人脸识别,开放统计类的移动应用分析。
本课时演示如何注册帐号、如何创建App、如何管理App、如何从“产品服务”和“我的语音云”中为App开通语音基础能力服务,并讲解Appid与App的关联关系。
本课时演示如何下载语音SDK、以Android为例详细讲解SDK的组成结构、在Eclipse中运行示例代码。
本课时演示从新建项目到语音识别API接入,再到实际编码来实现一个简单的Demo。
只有成为VIP会员才能提问&回复,快吧!如果你还没有账号你可以一个账号。
科大讯飞语音云 SDK 下载
科大讯飞语音云 SDK 下载
添加新技术问题
课程 [语音SDK介绍]
中已存在问题
添加新技术问题
问题描述越详细,被解答的速度越快
有新回答时请邮件提醒我
着急,拜托快点
不急,慢慢解决
关联课程 [语音SDK介绍]iOS 使用科大讯飞技术实现语音转文字(语音听写)_IOS开发-织梦者
当前位置:&>&&>& > iOS 使用科大讯飞技术实现语音转文字(语音听写)
iOS 使用科大讯飞技术实现语音转文字(语音听写)
本文主要介绍的是利用科大讯飞技术实现语音转文字的功能(语音听写).
首先,注册讯飞账号,申请APPID
然后,下载科大讯飞SDK将开发工具包中lib目录下的iflyMSC.framework添加到新建工程中.
按下图添加SDK所需要的iOS库。(除iflyMSC.framework,iflyMSC.framework是拖进去的)
接着,在appDelegate中引入头文件
#import“iflyMSC/IFlyRecognizerViewDelegate.h”
#import“iflyMSC/IFlyRecognizerView.h”
NSString *appid =
@&********&;//自己申请的appId
NSString *initString = [NSString
stringWithFormat:@&appid=%@&,appid];
[IFlySpeechUtility
createUtility:initString];
在相应的viewController里:
遵守协议&IFlyRecognizerViewDelegate&
@property(nonatomic,strong)IFlyRecognizerView*iflyRecognizerV
- (void)viewDidLoad {
viewDidLoad];
self.iflyRecognizerView = [[IFlyRecognizerView
alloc]initWithCenter:self.view.center];
self.iflyRecognizerView.delegate =
[self.view
addSubview:self.iflyRecognizerView];
[self.iflyRecognizerView
setParameter: @&iat&
forKey:[IFlySpeechConstant
IFLY_DOMAIN]];
//asr_audio_path保存录音文件名,默认目录是documents
[self.iflyRecognizerView
setParameter: @&asrview.pcm&
forKey:[IFlySpeechConstant
ASR_AUDIO_PATH]];
//设置返回的数据&#26684;式为默认plain
[self.iflyRecognizerView
setParameter:@&plain&
forKey:[IFlySpeechConstant
RESULT_TYPE]];
[selfstartListenning:self.iflyRecognizerView];//可以建一个按钮,点击按钮调用此方法
- (void)startListenning:(id)sender{
[self.iflyRecognizerView
NSLog(@&开始识别&);
//返回数据处理
- (void)onResult:(NSArray *)resultArray isLast:(BOOL)isLast
NSMutableString *result = [NSMutableString
NSDictionary *dic = [resultArray
objectAtIndex:0];
NSLog(@&DIC:%@&,dic);
for (NSString *key
[result appendFormat:@&%@&,key];
//把相应的控件赋&#20540;为result.例如:label.text =
- (void)onError:(IFlySpeechError *)error
这样就实现了利用科大讯飞语音转文字的功能.
以上就是iOS 使用科大讯飞技术实现语音转文字(语音听写)的全文介绍,希望对您学习和使用ios应用开发有所帮助.
这些内容可能对你也有帮助
更多可查看IOS开发列表页。
猜您也会喜欢这些文章

我要回帖

更多关于 讯飞语音听写 的文章

 

随机推荐