Ubuntu和Lazarus(Ubuntu and Lazarus)
今天我安装了ubuntu和lazarus IDE(delphi风格的跨平台ide)我对linux操作系统的结构一无所知。你知道一些教程可以让我开始专门用lazarus,linux有模块和api或者如何有用 ??
Today I installed Ubuntu and Lazarus IDE (Delphi style cross-platform IDE). I don't know anything about the file structure of Linux Operating Systems. Do you know some tutorials that can get me started specially with Lazarus, and does Linux have modules and API's or how does it work?
原文:https://stackoverflow.com/questions/4162726
最满意答案
你不应该使用f0和过零点,它们太不稳定。 您可以简单地增加训练数据并使用mcccs,它们具有良好的表示能力。 但记住要将它们标准化。
You should not use f0 and zero crossing, they are too unstable. You can simply increase your training data and use mfccs, they have good representation capabilitites. But remember to mean-normalize them.
相关问答
更多-
MFCC在语音识别中(MFCC in speech recognition)[2022-12-26]
你正在跳过一些关键的步骤。 让我简单解释它应该如何工作。 语音数据最初是一个离散信号。 你把它切成一个叫做“框架”的小片段,这样每个片段最好只包含一个电话。 通常帧被重叠以不丢失任何重要信息。 然后,您提取特征 - MFCC并使用隐藏马科夫模型搜索包含多个帧的最可能的单词。 在这个时候,你还需要一个单词发音词典和声学模型。 在下一个层次上,你使用一个语言模型来描述单词可以被构造的句子,并且得到最终的假设。 这是非常抽象的描述,因此需要在更接近的范围内检查每个解码步骤。 You are skipping so ... -
C#中的音频描述符MFCC(Audio descriptor MFCC in C#)[2022-10-22]
我不知道C#的这些库,但我可以向您展示我从大量幅度为16 kHz采样频率的wav文件中提取20个MFCC的实现。 您必须使用MatNet.Numerics和MatNet.Numerics 库 。 只有俄罗斯的评论,抱歉。 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Numerics; using ... -
如何用语音识别数据集训练HMM进行语音识别?(How to train HMM with audio senteces dataset for speech recognition?)[2023-08-30]
我是否需要将句子剪成单词或仅使用句子来训练HMM模型? 从理论上讲,你只需要句子和音素。 但是,隔离的单词可能对您的模型有用(它会增加训练数据的大小) 我需要火车的音素数据集吗? 如果是,我是否需要训练它也使用HMM? 如果不是我的程序如何识别HMM预测输入的音素? 您需要音素,否则如果您的模型没有任何孤立音素的示例,那么您的模型将难以找到正确的音素分段。 您应首先在隔离的音素上训练您的HMM状态,然后添加其余数据。 如果你有足够的数据,你的模型可以在没有孤立的音素例子的情况下学习,但我不会打败它。 我必须 ... -
MFCC采样频率(MFCC Sampling frequency)[2022-03-24]
看看mfcc的文档字符串 。 该函数的签名是 def mfcc(input, nwin=256, nfft=512, fs=16000, nceps=13): 正如你在问题中提到的那样, fs的默认值是16000.你可以在代码中使用fs=sr1来覆盖它: ceps1, mspec1, spec1 = mfcc(x1, fs=sr1) (关于python functons的关键字参数的更多信息,请参阅例如4.7.2。python教程中的关键字参数 。) Take a look at the docstri ... -
你可以用八度音程从RASTAMAT运行mfcc代码,你只需要修改一些东西,固定版本可以在这里下载。 更改是在powspec.m中正确设置窗口 WINDOW = hanning(winpts); 并修复与Matlab不兼容的specgram函数中的错误 。 You can run mfcc code from RASTAMAT in octave, you only need to fix few things, the fixed version is available for download h ...
-
您可以使用此处提供的答案/指导 根据您用来创建LSTM(pybrain,theano,keras)的库,您可以查看他们的文档。 我建议使用Theano(二进制LSTM 链接 )或Keras( 教程) ,因为它们很容易理解并且有很好的文档记录。 希望这可以帮助。 You can use the answer/guidance provided here Depending on what library you are using to create your LSTM(pybrain, theano, ke ...
-
请尝试以下方法。 解释包含在代码中。 import numpy import librosa # The following function returns a label index for a point in time (tp) # this is psuedo code for you to complete def getLabelIndexForTime(tp): # search the loaded annoations for what label corresponsons ...
-
如何在识别过程中改变未识别语音信号的长度?(How to change the length of the unidentified speech signal during recognition?)[2021-11-20]
通过提取N帧在时间上更近或更远的特征,可以获得等效的MxN特征向量,以获得“时间拉伸”信号。 You can get an equivalent MxN feature vector to one for a "time stretched" signal by extracting the features with the N frames spaced closer together or farther apart in time. -
你不应该使用f0和过零点,它们太不稳定。 您可以简单地增加训练数据并使用mcccs,它们具有良好的表示能力。 但记住要将它们标准化。 You should not use f0 and zero crossing, they are too unstable. You can simply increase your training data and use mfccs, they have good representation capabilitites. But remember to mean-n ...
-
如何使用mfcc功能训练svm分类器进行语音识别?(how to use mfcc feature to train a svm classifier for voice recognition?)[2021-07-06]
对于像语音识别这样的序列标记任务,您需要使用SVM和HMM的组合,而不仅仅是SVM 使用GMM-HMM将特征矩阵与状态对齐,获得与每个HMM状态对应的特征 在属于每个州的功能上训练SVM 实施SVM-HMM而不是GMM-HMM 了解更多信息 http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.442 为了加快速度,请使用现有的工具包,例如: http://www.cs.cornell.edu/people/tj/svm_light/svm_h ...