注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

itas109的博客

http://blog.csdn.net/itas109

 
 
 

日志

 
 

语音识别中的鸡尾酒会问题  

2015-09-12 13:48:26|  分类: Machine Learning |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
概念

“ 鸡尾酒会问题”(cocktail party problem)是在计算机语音识别领域的一个问题。当前语音识别技术已经可以以较高精度识别一个人所讲的话,但是当说话的人数为两人或者多人时,语音识别率就会极大的降低,这一难题被称为鸡尾酒会问题。

 

解决方案  

斯坦福大学的Andrew NG教授的机器学习公开课(http://v.163.com/special/opencourse/machinelearning.html)(ml-class.org)在第一章unsupervised learning那段视频里解决鸡尾酒会问题(cocktail
party problem)就写了一行代码:[W,s,v] = svd ((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

用fastICA算法可以比较好地解决http://research.ics.tkk.fi/ica/fastica/


http://www.endolith.com/wordpress/2009/11/22/a-simple-fastica-example/
是一个分离音乐的例子,效果比较明显。用的就是fastICA的python实现。不过好像用来解决cocktail party problem的话效果不太好。


Blind Source Separation of recorded speech and music signals:http://cnl.salk.edu/~tewon/Blind/blind_audio.html

  评论这张
 
阅读(164)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017