2021秋招贝壳找房语音算法岗面经


1面 8.22

  1. 常规自我介绍

  2. 对语音(算法)这块有多少的了解?(因为本人之前不是做语音的)

  3. 有实际跑过语音(识别)这块的工具 / 流程吗?实践过吗?

  4. 一个语音识别系统,大致是怎么样的流程?

  5. 你用过哪种声学模型?GMM 还是 DNN?说一下声学模型的输入和输出分别是什么?

    • 输入:一帧一帧的声学特征
    • 输出:这一帧声学特征对应的概率分布
  6. 你简历里提到的了解的决策树指的是什么决策树?说一说应用场景?

  7. 你知道语音识别中这个决策树是用在哪吗?

    声学模型的类别:不同发音,如果只按声母韵母来分类的话太粗了,需要进一步细分,到底怎么做决定这个类别的话,人为是没法分的,所以用决策树来划分这个发音的类别。

  8. HMM的原理说一下。

  9. 介绍一下项目。

  10. 代码题:

    1. 实现哈希表的插入操作 (C++)
    2. 实现插入排序

以上的问题和面试官给的答案,下面是自己整理的部分答案。

  1. 通过消除噪声和信道增强等预处理技术,将信号从时域转化到频域,然后为之后的声学模型提取有效的特征向量。接下来声学模型会将预处理部分得到的特征向量转化为声学模型得分,与此同时,语言模型,也就是我们前面在自然语言处理中谈到的类似 n-gram 和 RNN 等模型,会得到一个语言模型得分,最后解码搜索阶段会针对声学模型得分和语言模型得分进行综合,将得分最高的词序列作为最后的识别结果。

  2. 感觉面试官问的是 GMM 的输入和输出,而不是声学模型的输入和输出。(如有大佬还请赐教)

  3. 讲了讲ID3,C4.5和CART树和他们的划分准则。(感觉面试官的意思是想要我解释一下,怎么算是一棵决策树)

    应用场景:

    各种机器学习算法的应用场景分别是什么(比如朴素贝叶斯、决策树、K 近邻、SVM、逻辑回归最大熵模型)? - xyzh的回答 - 知乎

    因为它能够生成清晰的基于特征(feature)选择不同预测结果的树状结构,数据分析师希望更好的理解手上的数据的时候往往可以使用决策树。

  4. 有点长,从HMM要满足的两个条件,三个问题说开来去。