服务热线

091-403896421
网站导航
主营产品:
新闻中心
当前位置:主页 > 新闻中心 >

科大讯飞胡郁:再过四到五年时间,机器语音识别就能达到人类水准

时间:2022-07-15 11:56 点击次数:
 本文摘要:推:这是科大信飞轮值总裁胡郁在2016网易科技未来峰会上发表的题目《“人工智能”以语音和语言为入口的认知革命》的演说。(公众号:)整理,有删除。 刚才(华大基因理事长)汪建先生说未来的世界是生命科学技术的时代。我同意那个。 将来人类的命运掌握在我们手中,我们可以改建自己。人类也想扮演上帝的角色。 人类之所以需要在地球上统治世界是因为我们有智能。因为现在在某种程度上自己有智能。也需要构建新的智能。

博冠体育

推:这是科大信飞轮值总裁胡郁在2016网易科技未来峰会上发表的题目《“人工智能”以语音和语言为入口的认知革命》的演说。(公众号:)整理,有删除。

刚才(华大基因理事长)汪建先生说未来的世界是生命科学技术的时代。我同意那个。

将来人类的命运掌握在我们手中,我们可以改建自己。人类也想扮演上帝的角色。

人类之所以需要在地球上统治世界是因为我们有智能。因为现在在某种程度上自己有智能。也需要构建新的智能。

当今世界,各种智能层出不穷,暂时使用了“智能”一词,智能应该向什么方向发展,智能到底应该给我们带来什么? 今天我想带着这个疑惑向大家探究一下。今年3月有非常有名的阿尔法戈战李世石,在此之前有很多人得到了预测。

包括我自己在内,我当时的预测是机器人一定要战胜人类。为什么呢,只是研究界有名的语言,机器人要在智能方面战胜人类,肯定不是用人的想法,而是用它最擅长的方法。

我们本来下棋是很高尚的运动,不是每个人都能打好棋手,但机器显然不希望如此。这场比赛结束时,凤凰卫视《一虎一席谈》要求古力九段、柯洁九段、阿尔法go和李世石讨论战斗,柯洁九段在《一虎一座谈》。阿尔法戈为什么需要战胜人类,显然不是用人类擅长的方法,而是用机器擅长的方法。

阿尔法戈需要同时计算下棋几十步到一百步的可能性。另外,阿尔法戈必须忘记三千万种方法的对局。这个我们人类不擅长。

但是人工智能有必要在各方面打败人类吗? 因为棋手看到几乎是信息半透明时的公开发表博弈论,就像以前的国际象棋一样,机器占有相当的优势。很多人问人工智能到底反映在什么方面。我们告诉人类有农业革命、产业革命,还有现在正在谈论的信息革命,但可能有很多人不说人类统治地球的过程中只是经过了漫长的历史发展。

一本书《人类简史》写道,人类已经在地球上出现了200万到300万年,这些人类在世界各地,是我们谈论的猿人、欧洲的原始人、中国的山顶洞人、元谋人、蓝因人。但是,根据历史学家和基因工人的研究,7万年前,智人从非洲回来灭绝了其他猿人。现在无论是黑人白人、棕色人种还是黄色人种,都是智人的后代。在这个过程中,正如智人突然醒悟到的那样,人类智能在经过2300万年的发展中突然大踏步前进,是什么让他们跑到了这一点? 历史学家称他们为“理解的革命”。

他们发现仅次于其他猿人的区别是他们的语言非常丰富,对话,生成文字,生成文字,有一些好处。第一个好处是河里有一头狮子,告诉你狮子的长度。更重要的是,有语言,有语音,所以我们可以阐述团队和团队的关系。

没有语言,现在动物群中的黑猩猩,一个团队达不到50只,多达50只就无法管理。但是智人有话要说,因为他们能组织成千上万的团队。第二个优点是有语言就能说出我们共同想象的内容。一些虚构的概念是“公司”、“梦想”从那以后创造出来的。

所以,现在历史学家最重要的观点之一是人类的认知革命将人类的智能带回新的高度。机器是擅长的运算智能,但就感觉智能而言,机器只不过比我们差得多。这也是科大信飞目前贯彻的以语音和语言为入口的计算机认知革命。

我们继续执行的通信来超脑计划想做的事情是让机器通过传感器和算法的感觉世界,需要理解自然的人类世界,成为我们人工智能最重要的突破口。如何构建这样的突破我们有两种不同的方法。一个和我们的脑科学非常有关系。我们可以分析大脑的所有神经元结构及其工作机制。

另外,根据大脑整体的动作机制,确实可以重构和大脑完全一样的机制另一个想法是,使用互联网的思维,利用我们的机器学习算法和大数据,几乎不模仿大脑,但利用机器运算我们在研究用飞机飞行鸟类,但我们没有做鸟。因为我们教了鸟飞行中的空气动力学。

我们正在研究大脑,不仅复制了大脑,还想寻找大脑的智力动力学,进一步优化我们自学整体的算法。从另一个角度,用网络思维解决问题,改良我们的人工智能,就要感谢三个方面的进展:一是人工神经网络,这个人工神经网络就像我说的,只是告诉了大脑非常简单的机制另外,多亏了互联网和移动互联网,我们才能得到大量的数据。

更重要的是,我们有千万的算法,有往返于用户的产品正是因为有了这三者的接受,我们才取得了很好的结果。确实,人工智能的框架是什么样的? 我推荐另一个例子。

人的大脑皮质在工作中分为两个层次。一个是感觉水平。另一个是视觉、听力和触觉。

另一个是理解水平。看到猫的时候,听到猫的叫声,摸猫的毛皮。

大脑有概念。这些概念构成我们语言的单词和词汇。所以,在通信飞来超脑中分为两个层次。感觉智能在识别我们听到的、看到的、触觉的同时,将识别结果降低到我们理解智能的水平,构成概念空间的响应和推理小说,在过去的五年里,我们不断地将深入的自学网络应用到刚才我们谈论的感觉和理解中。

(工作人员播放了三个语音剪辑)这是语音段落,第一个是“睡觉”,第二个是“休息室”,但听了原来的段落就不教了(类似于大脑自动“失真补正”)。原来这句话是“0100”。人脑是怎么工作的? 人脑必须记住短时间、中间或宽时间的记忆,必须用反复的方法识别声音。

现在,最新型的迭代神经网络需要模拟我们大脑的感觉。这个过程非常复杂,我不解释。

但是只是有反复,需要记忆。最近的一个方法是用我们正在谈论的图像方法识别声音。

当声音进入我们的耳朵时,我们耳朵的纤毛根据其长度不会以与声音不同的频率共振。分析共振的频率,我们就能得到语言频谱。这个图形的信息非常丰富,是MIT专业的。

我们的识别系统如果需要阅读这些图的话,性能整体的稳定性就不会提高那么多。如果你是盲人,你的耳朵就不是特别那个灵。因为在视神经方面可以借用我们的神经系统和细胞,从而借用其能力。

博冠体育

我们应用于新的卷积神经网络,它本来特别用于制作图像,处理我们的语音图像,我们得到了一些惊人的结果:在卷积神经网络——中也是识别图像的方法,我们依然现在我们的声音不仅可以听到,而且可以看到。根据这样的结果,在我们的各种输入法中,在我们的语音检索中,还有在我们的各种语音交互系统中,语音识别的错误率每年以30%的水平上升,因此我们最后的语音识别系统在4~5年后是人类整体的感受在感觉方面,我们的语音识别技术大幅度提高,但在理解方面,完成了一些非常核心的任务,超脑的语言解读和深层,科学知识解释和推理小说,还有来自主自学,构建这些技术需要两个层次的东西。

第一,必须解决问题的自然语言叙述问题,并在此基础上解决问题的语言解读和深层。我刚才提到了概念在大脑皮质中的反应。这是图,有不同的语言。

那些概念是空间的。比如,“大家都很好”,传统的传达,每个词都代表空间。

我们把每个词经常出现的东西看作“1”,不怎么出现的东西看作“0”。现在我们用倒数的空间来表达语言。每个单词、每个单词是“单词卷积”的方法,是倒数数字,等于一个空间内的坐标系,让两个单词之间的距离可以计算它。我们把所有的话都凝结起来,就能看到新浪、网易、腾讯等结果。

这些东西是相连的。我能看到吕布,张飞,关羽,诸葛亮。他们很像。

用医学方法测定的话,不知道大脑皮质中保存语言的方位也非常相似。利用这个方法,我们建立了表达语言空间概念的传达体系。在这样的传达体系下,我们可以进一步分析语言水平、句子水平和篇章水平、他们在各级的联系和计算出的距离。

做好了这个,我们来看看一些实际作用。他们能做什么呢? 首先,让我们来看看语言的解读和深层。让我们先看看翻译。在翻译方面,我们教他们开展句子锻炼。

因为因语言而异,所以这个时候是人脑中最重要的概念,关注度模型,比如我们在看图像。海边有灯塔。

我们关注的是灯塔而不是其他方面。这张图很有趣。

上图是男司机在开车时仔细观察各种东西。下图是女司机,她的想法很狭隘。让我们看看文字。

这两天正好是欧洲杯。我们的注意力只是集中在那些文字中信息量大的地方。

这个关注度模型是自动找到我们最关注的输入量并应对我们最后结果的方法。让我们看看基于机器翻译的实际例子:在不同的语言之间,有他们的机器翻译,比如很多谓语、主语、宾语,它们的方位不同,倒置和顺序都不会再次发生很多变化。原来用规则的方法叙述这些变化非常复杂,通过我们现在谈论的这个神经网络。与传统系统相比,使用新神经网络的翻译系统没有什么提高。

让我们看一下明确的例子。我们最近教科大通讯飞在教育方面做了非常多的工作。

我们需要利用机器人向我们的老师展开卷面考试。比如,我写了作文。

这篇作文希望机器人也能给它打分并发表评论。看看这个样品。右边94分是这篇文章的分数,右边有评论。

然后,从这篇文章可以看出它使用了排位比。里面用了几个句子的提及。

我们怎么做,才能让机器也理解这些事情? 机器的关注度如何自动落到这些重要的地方呢? 只是,很简单。右边是范文。我刚才说了。

在倒计时空间响应。这些范文和作文向量利用我们的关注度模型不寻找自动访问的地方。你应该说话。

现在我们的结果是中考和中考的作文审查,无论是中文还是英语都能取得很好的效果。最后看看读者的解读问题。看到“看到新月影在水里摇摆的鸭子,以为是鱼,急忙游泳”这句话,现在抠出“鸭子”,机器看到这句话就自动告诉你应该堆在上面的地方,利用我们现在的系统,把章节和问题那可以计算出各地方有热度(关注度)。之后,你可以发现“小鸭子”的关注度最低,把“小鸭子”堆在这个地方。

然后你可以把它填满。现在在读者解读方面可以超过6岁孩子的水平。

6岁的孩子在常识性解读方面超过了一个水平,6岁以后主要学习各种科学知识。这是我们理解的,2岁、3岁、4岁构成个人最重要的自学能力,在这方面最完全一致。我相信6岁孩子的常识自学能力超过后,我们可以教他小学、中学、高中的科学知识,然后最后考大学。

原创文章,发布许可禁令刊登。以下,听取刊登的心得。


本文关键词:博冠体育,科大,讯飞,胡郁,再过,四,到,五年,时间,机器

本文来源:博冠体育-www.north-oceancapital.com

Copyright © 2008-2022 www.north-oceancapital.com. 博冠体育科技 版权所有  备案号:ICP备19746983号-4

地址:湖北省荆门市廉江市路海大楼4509号 电话:091-403896421 邮箱:admin@north-oceancapital.com

关注我们

服务热线

091-403896421

扫一扫,关注我们