AI人工智能加持的录音笔可以产生质变——科大讯飞智能录音笔SR702
ChatGPT腾空出世,不可一世的google首度发出红色预警,因为AI的出现动摇了搜索引擎的根基,AI与web3.0的出现让互联网世界格局的地基发生了深入根部的裂痕,确实因为AI的出现,让搜索引擎变成了上古获取信息的模式,国内各种AI大模型也纷纷发布,首当其中的就是百度,阿里与科大讯飞。
科大讯飞前一阵子发布了讯飞星火认知大模型,众所周知,科大讯飞本身的优势就是语音识别技术、翻译这类听、说、理解语义这些方面,所以讯飞在AI方面发力是可以预料的,因为AI技术层面的加持,对于讯飞目前的领域是可以产生质变的。
讯飞目前推出的AI+硬件也都是结合其自身优势的产品。
现在有了AI的加持,讯飞家的产品都可以加上智能两个字了,而且是真正的智能。其中就包括科大讯飞的拳头产品——科大讯飞智能录音笔SR702。
一,哪些人群会用到录音笔(or翻译机)?
二,用得着买这么贵的录音笔?为什么不用手机?
三,高端录音笔应该做成什么样子
四,AI加持,目前国内最贴近实用的[真智能]硬件
五,AI带给我的思考
一句话说清楚区别就是,工作量。
比如你是个律师,现在有个案子要整理20公斤正反面的A4纸质文件,你怎么办?
再或者你是一个作家、编辑、视频博主,你有大量的创造性思维需要快速记录,并整理成文字,你会怎么办?
所以,录音笔适合哪些人群?大概也就是律师,记者、编辑、作家、讲师、视频自媒体、音乐创作者、外企员工之类的吧。
那有必要买录音笔吗?这里科普一个冷知识,在商业行为中音频转成文字是要收费的,OCR图片识别文字一般也都是收费服务。
【讯飞语记APP】是一款可以实现录音转写,OCR识别,笔记翻译等功能的软件,也是讯飞家的,如果想使用全部的功能,SVIP是418/年,当然这里只是拿讯飞语记举个例子,市面上的其他产品也同样都是如此。而其些功能在科大讯飞智能录音笔SR702是全部可以免费实现的,而且SR702还送三年20G免费云空间。
以上是软件方面的功能,在硬件方面科大讯飞智能录音笔SR702有3.5寸屏幕,3D陶瓷背板,800万像素,2600mAh电池。Ok,这些都不如手机,但SR702还有两个10mm的定向麦克风可以接收15m远距离的声音,还有6个全向麦克风,双击即可录音的快捷键,陶瓷背板手感极佳,顺滑而舒适一手可握的体积,与172g的重量。这些让SR702在记录声音方面有着绝大优势。
因为录音笔的硬件配置相比手机更强大,软硬结合的功能更多,而且很多收费项目可以免费使用,也就是说,用的越多越省钱,计算下一年需要开多少个会,有多少文稿需要整理,算一下使用频率就会发现确实物有所值。
顶部两颗定向收音麦克非常醒目,经过测试随意将麦克对向声源,录下的声音会比本人听到的声音更清晰,是因为在机器正面屏幕两侧分别还有六颗全向收音麦克,2+6的配置配合智能降噪,让你可以完整纪录当时身边发出的一切人声。
背板是3D陶瓷工艺,只手可握,清凉而顺滑,顶部为了满足10mm的定向麦克风与摄像头会稍微厚一些,手握机身部分非常轻盈与纤薄,手感极佳。
两个麦克风之间是一颗800万的摄像头与闪光灯,可以用于OCR拍照识别文字、表格。还可以用于拍视频并实时生成字幕。
底部左侧是外放,右侧是为了对称挖的孔,充电是type-c口,也可以用于连接电脑传输录下的音频文件,导出的文档。
左侧分别是录音键与音量键,任何场景双击录音键即可开始录音,快捷又隐秘,长按则会呼出语音助手,可以进行一些简单的语音控制。
右侧为开关机键与sim卡槽。
科大讯飞智能录音笔SR702支持离线录音转文字,如果你在可以联网的场景可以将文字准确率提高到98%,除了中文还支持英语、日语共10种语言转写,方言更是不在话下,甚至还支持藏语与维吾尔族语的转写,我试过2019年的藏语电影《气球》,翻译效果与字幕无异,甚至获得了更多信息(比如一些脏话,呵呵)。
科大讯飞智能录音笔SR702还支持英、日、韩、俄、法、西班牙、越南语7种外语与中文互译,我用《星际穿越》、《进击的巨人》测试英日两项的互译,效果极强。可以免费无限制使用图片OCR转文字,800万像素摄像头在此起到了作用,智能提取PPT,excel内文字,都是轻松搞定,甚至手写笔记也可以识别。此外录制的视频也可以自动生成字幕,对于视频自媒体作者可以提高工作效率。
以上是科大讯飞智能录音笔SR702的传统艺能,在未加入星火认知大模型之前以上功能也都能实现,算是人类社会未出现AI之前最接近智能的效果了,也都是科大讯飞的传统强项。科大讯飞在发布自家AI大模型之后,SR702增加了两个功能,分别是【语篇规整】与【会议纪要】。
另外还要提一个功能点,就是SR702在生成采访型文稿的时候,可以自动按照说话人进行区分,用一下谋女郎经典的采访桥段《嗯~,怎么不算呢?》
讯飞这个【区分讲话人】的功能太厉害了,我发现录得越多,AI越能分辨两个人声音的区别,到了web端还可以将讲话人进行名称修改,稍微整理一下,就可以出稿了。这次测试本身用的就是成稿采访片段,所以基本没什么口水词,所以我手动加了很多嗯、啊、内个、那啥这种口水词,在经过【语篇规整】之后都被消除掉了,非常强。
还是试一下,让各位看一下星火认知大模型的落地效果如何,还是将刚才的《废话文学》拿出来试一下,这段文字我看了都挠头,说了几百字好像什么都没说,领导讲话有时候就是这样,让人抓不住重点。但在AI面前,都不是问题,AI仍然可以把【关键问题】浓缩成一段话。
我曾经用AI来写我家智能门锁的欢迎词,一下子写了十条,每一条都非常棒,AI在通顺语句,整理话术,总结方面都是非常强的,这些功能点在文案处理方面也是最落地的,正好也是音频转文案之后编辑环节最需要的。