Ідентифікація голосу в системах розумний дім

DOI №______

  • Мельник Ю. В. (Melnyk Yu. V.) Державний університет телекомунікацій, Київ
  • Сторчак К. П. (Storchak K. P.) Державний університет телекомунікацій, Київ
  • Пушкарьов Д. М. (Pushkariov D. M.) Державний університет телекомунікацій, Київ
  • Дорошенко Д. В. (Doroshenko D. V.) Державний університет телекомунікацій, Київ
  • Попов Д. Л. (Popov D. L.) Державний університет телекомунікацій, Київ

Анотація

Розглянуто алгоритм розпізнавання голосу для ідентифікації особи на основі перетворення Габора і його використання в системі «розумний дім». Запропонований підхід базується на створенні спектрограми, яка служить голосовою базою і з якої виділяються ознаки голосу, розпізнається голос особи, виконується команда та вимовляється відповідь. Перевірка особи проводиться з використанням класичної нейронної мережі.

Ключові слова: нейронна мережа, розпізнавання голосу, ідентифікація особи, перетворення Габора, евристичний алгоритм, розумний дім.

Список використаної літератури
1. Awan S. N. Validation of the cepstral spectral index of dysphonia as a screening tool for voice disorders: development of clinical cutoff scores/ S. N. Awan, N. Roy, D. Zhang, S. M. Cohen // Journal of Voice. – 2016. ‒ Vol. 30, №2. ‒ P. 130-144.
2. Cpałka K. A new algorithm for identity verification based on the analysis of a handwritten dynamic signature/ K. Cpałka, M. Zalasi´nski, L. Rutkowski // Applied soft computing. – 2016. ‒ Vol. 43. ‒ P. 47-56.
3. Gregor K. "Draw: A recurrent neural network for image generation / K. Gregor, I. Danihelka, A. Graves, D. J. Rezende, D. Wierstra. // https://arxiv.org/abs/1502.04623. ‒ 2015.
4. Grycuk R. Content-based image retrieval optimization by differential evolution / R. Grycuk, M. Gabryel, R. Nowicki, R. Scherer // IEEE Congress on. – 2016. ‒ P. 86-93.
5. Kim J. Finger-knuckle-print for identity verification based on difference images / J. Kim, J. Teoh, A. Toh // IEEE 11th Conference on. – 2016. ‒ P. 1073–1077.
6. Mirjalili S. Dragonfly algorithm: a new meta-heuristic optimization technique for solving single-objective, discrete, and multi-objective problems/ S. Mirjalili // Neural Computing and Applications. – 2016. ‒ Vol. 27, № 4. ‒ P. 1053-1073.
7. Pal M. On robustness of speech based biometric systems against voice conversion attack / M. Pal, G. Saha // Applied Soft Computing. – 2015. ‒ Vol. 30. ‒ P. 214-228.
8. Scherer M. Image descriptor based on edge detection and crawler algorithm / R. Grycuk, M. Gabryel, M. Scherer, S. Voloshynovskiy // International Conference on Artificial Intelligence and Soft Computing. – 2016. ‒ P. 647-659.
9. Usha M. Objective identification of prepubertal female singers and non-singers by singing power ratio using matlab / M. Usha, Y. Geetha, Y. Darshan // Journal of Voice. – 2016.
10. Werbos P. Beyond regression: New tools for prediction and analysis in the behavioral sciences / P. Werbos. – 1974.
11. Williams D. Learning representations by backpropagating errors / D. Williams, G. Hinton // Nature. – 1986. ‒ Vol. 323. ‒ P. 533-536.
12. Краснова Е. М. Оценка эффективности акустико-спектрографического метода распознавания голоса нативной и неродной речи / Е. М. Краснова, Е .В. Булгакова, В. В. Шемелинин. – Москва: 2016. – 56 с.

Опубліковано
2019-03-14
Номер
Розділ
Статті