Word And Speaker Recognition System

Shwu Fei Tan
{'id': 'https://openalex.org/W3197877226', 'doi': None, 'title': 'Word And Speaker Recognition System', 'display_name': 'Word And Speaker Recognition System', 'publication_year': 2010, 'publication_date': '2010-01-01', 'ids': {'openalex': 'https://openalex.org/W3197877226', 'mag': '3197877226'}, 'language': 'en', 'primary_location': {'is_oa': False, 'landing_page_url': 'http://utpedia.utp.edu.my/797/', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}, 'type': 'article', 'type_crossref': 'journal-article', 'indexed_in': [], 'open_access': {'is_oa': False, 'oa_status': 'closed', 'oa_url': None, 'any_repository_has_fulltext': False}, 'authorships': [{'author_position': 'first', 'author': {'id': 'https://openalex.org/A5033922126', 'display_name': 'Shwu Fei Tan', 'orcid': None}, 'institutions': [], 'countries': [], 'is_corresponding': True, 'raw_author_name': 'Shwu Fei Tan', 'raw_affiliation_strings': [], 'affiliations': []}], 'institution_assertions': [], 'countries_distinct_count': 0, 'institutions_distinct_count': 0, 'corresponding_author_ids': ['https://openalex.org/A5033922126'], 'corresponding_institution_ids': [], 'apc_list': None, 'apc_paid': None, 'fwci': 0.0, 'has_fulltext': False, 'cited_by_count': 0, 'citation_normalized_percentile': {'value': 0.0, 'is_in_top_1_percent': False, 'is_in_top_10_percent': False}, 'cited_by_percentile_year': {'min': 0, 'max': 64}, 'biblio': {'volume': None, 'issue': None, 'first_page': None, 'last_page': None}, 'is_retracted': False, 'is_paratext': False, 'primary_topic': {'id': 'https://openalex.org/T12222', 'display_name': 'Wireless Home Automation Systems', 'score': 0.6946, 'subfield': {'id': 'https://openalex.org/subfields/2208', 'display_name': 'Electrical and Electronic Engineering'}, 'field': {'id': 'https://openalex.org/fields/22', 'display_name': 'Engineering'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, 'topics': [{'id': 'https://openalex.org/T12222', 'display_name': 'Wireless Home Automation Systems', 'score': 0.6946, 'subfield': {'id': 'https://openalex.org/subfields/2208', 'display_name': 'Electrical and Electronic Engineering'}, 'field': {'id': 'https://openalex.org/fields/22', 'display_name': 'Engineering'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T12406', 'display_name': 'Smart Vehicle Safety and Monitoring Systems', 'score': 0.6789, 'subfield': {'id': 'https://openalex.org/subfields/2210', 'display_name': 'Mechanical Engineering'}, 'field': {'id': 'https://openalex.org/fields/22', 'display_name': 'Engineering'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10201', 'display_name': 'Speech Recognition Technology', 'score': 0.6484, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}], 'keywords': [{'id': 'https://openalex.org/keywords/dynamic-time-warping', 'display_name': 'Dynamic time warping', 'score': 0.7586578}, {'id': 'https://openalex.org/keywords/speaker-diarisation', 'display_name': 'Speaker diarisation', 'score': 0.67277}, {'id': 'https://openalex.org/keywords/speaker-verification', 'display_name': 'Speaker Verification', 'score': 0.67086}, {'id': 'https://openalex.org/keywords/automatic-speech-recognition', 'display_name': 'Automatic Speech Recognition', 'score': 0.591976}, {'id': 'https://openalex.org/keywords/mel-frequency-cepstrum', 'display_name': 'Mel-frequency cepstrum', 'score': 0.589005}, {'id': 'https://openalex.org/keywords/end-to-end-speech-recognition', 'display_name': 'End-to-End Speech Recognition', 'score': 0.571996}, {'id': 'https://openalex.org/keywords/speaker-diarization', 'display_name': 'Speaker Diarization', 'score': 0.548524}, {'id': 'https://openalex.org/keywords/word-error-rate', 'display_name': 'Word error rate', 'score': 0.5350038}, {'id': 'https://openalex.org/keywords/statistical-language-modeling', 'display_name': 'Statistical Language Modeling', 'score': 0.527062}], 'concepts': [{'id': 'https://openalex.org/C28490314', 'wikidata': 'https://www.wikidata.org/wiki/Q189436', 'display_name': 'Speech recognition', 'level': 1, 'score': 0.8658502}, {'id': 'https://openalex.org/C133892786', 'wikidata': 'https://www.wikidata.org/wiki/Q1145189', 'display_name': 'Speaker recognition', 'level': 2, 'score': 0.809044}, {'id': 'https://openalex.org/C88516994', 'wikidata': 'https://www.wikidata.org/wiki/Q1268863', 'display_name': 'Dynamic time warping', 'level': 2, 'score': 0.7586578}, {'id': 'https://openalex.org/C41008148', 'wikidata': 'https://www.wikidata.org/wiki/Q21198', 'display_name': 'Computer science', 'level': 0, 'score': 0.7472613}, {'id': 'https://openalex.org/C149838564', 'wikidata': 'https://www.wikidata.org/wiki/Q7574248', 'display_name': 'Speaker diarisation', 'level': 3, 'score': 0.67277}, {'id': 'https://openalex.org/C150856459', 'wikidata': 'https://www.wikidata.org/wiki/Q8034367', 'display_name': 'Word recognition', 'level': 3, 'score': 0.61637807}, {'id': 'https://openalex.org/C199833920', 'wikidata': 'https://www.wikidata.org/wiki/Q612536', 'display_name': 'Vector quantization', 'level': 2, 'score': 0.61189574}, {'id': 'https://openalex.org/C151989614', 'wikidata': 'https://www.wikidata.org/wiki/Q440370', 'display_name': 'Mel-frequency cepstrum', 'level': 3, 'score': 0.589005}, {'id': 'https://openalex.org/C90805587', 'wikidata': 'https://www.wikidata.org/wiki/Q10944557', 'display_name': 'Word (group theory)', 'level': 2, 'score': 0.5854773}, {'id': 'https://openalex.org/C40969351', 'wikidata': 'https://www.wikidata.org/wiki/Q3516228', 'display_name': 'Word error rate', 'level': 2, 'score': 0.5350038}, {'id': 'https://openalex.org/C2778263558', 'wikidata': 'https://www.wikidata.org/wiki/Q46384', 'display_name': 'Microphone', 'level': 3, 'score': 0.4947769}, {'id': 'https://openalex.org/C154945302', 'wikidata': 'https://www.wikidata.org/wiki/Q11660', 'display_name': 'Artificial intelligence', 'level': 1, 'score': 0.4457319}, {'id': 'https://openalex.org/C52622490', 'wikidata': 'https://www.wikidata.org/wiki/Q1026626', 'display_name': 'Feature extraction', 'level': 2, 'score': 0.34857196}, {'id': 'https://openalex.org/C153180895', 'wikidata': 'https://www.wikidata.org/wiki/Q7148389', 'display_name': 'Pattern recognition (psychology)', 'level': 2, 'score': 0.34667024}, {'id': 'https://openalex.org/C33923547', 'wikidata': 'https://www.wikidata.org/wiki/Q395', 'display_name': 'Mathematics', 'level': 0, 'score': 0.10309008}, {'id': 'https://openalex.org/C41895202', 'wikidata': 'https://www.wikidata.org/wiki/Q8162', 'display_name': 'Linguistics', 'level': 1, 'score': 0.08197138}, {'id': 'https://openalex.org/C76155785', 'wikidata': 'https://www.wikidata.org/wiki/Q418', 'display_name': 'Telecommunications', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C138885662', 'wikidata': 'https://www.wikidata.org/wiki/Q5891', 'display_name': 'Philosophy', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C2524010', 'wikidata': 'https://www.wikidata.org/wiki/Q8087', 'display_name': 'Geometry', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C554936623', 'wikidata': 'https://www.wikidata.org/wiki/Q199657', 'display_name': 'Reading (process)', 'level': 2, 'score': 0.0}, {'id': 'https://openalex.org/C68115822', 'wikidata': 'https://www.wikidata.org/wiki/Q1068172', 'display_name': 'Sound pressure', 'level': 2, 'score': 0.0}], 'mesh': [], 'locations_count': 1, 'locations': [{'is_oa': False, 'landing_page_url': 'http://utpedia.utp.edu.my/797/', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}], 'best_oa_location': None, 'sustainable_development_goals': [{'display_name': 'Gender equality', 'score': 0.63, 'id': 'https://metadata.un.org/sdg/5'}], 'grants': [], 'datasets': [], 'versions': [], 'referenced_works_count': 0, 'referenced_works': [], 'related_works': ['https://openalex.org/W3202637686', 'https://openalex.org/W3012458383', 'https://openalex.org/W2849543406', 'https://openalex.org/W2835003682', 'https://openalex.org/W2461100152', 'https://openalex.org/W2417944484', 'https://openalex.org/W2416972381', 'https://openalex.org/W2390013786', 'https://openalex.org/W2378699295', 'https://openalex.org/W2368841583', 'https://openalex.org/W2279601331', 'https://openalex.org/W2209616930', 'https://openalex.org/W2169379024', 'https://openalex.org/W2159554773', 'https://openalex.org/W2130633733', 'https://openalex.org/W2099989787', 'https://openalex.org/W1970329478', 'https://openalex.org/W1870866543', 'https://openalex.org/W1491159402', 'https://openalex.org/W102400494'], 'abstract_inverted_index': {'In': [0], 'this': [1], 'report,': [2], 'a': [3, 30, 33, 42], 'system': [4, 139], 'which': [5], 'combines': [6], 'user': [7], 'dependent': [8, 13], 'Word': [9, 18], 'Recognition': [10, 124], 'and': [11, 67, 103, 136], 'text': [12], 'speaker': [14, 75, 137, 151], 'recognition': [15, 19, 70, 112, 132, 138, 148, 152], 'is': [16, 20, 37, 73, 129, 144, 153], 'described.': [17], 'the': [21, 38, 47, 74, 78, 82, 115], 'process': [22], 'of': [23, 114], 'converting': [24], 'an': [25], 'audio': [26], 'signal,': [27], 'captured': [28], 'by': [29], 'microphone,': [31], 'to': [32, 40, 117], 'word.': [34], 'Speaker': [35, 69, 123], 'Identification': [36], 'ability': [39], 'recognize': [41], 'person': [43], 'identity': [44], 'base': [45], 'on': [46, 77], 'specific': [48], 'word': [49, 111, 135, 147], 'he/she': [50], 'uttered.': [51], 'A': [52], "person's": [53], 'voice': [54], 'contains': [55], 'various': [56], 'parameters': [57], 'that': [58, 140], 'convey': [59], 'information': [60], 'such': [61], 'as': [62], 'gender,': [63], 'emotion,': [64], 'health,': [65], 'attitude': [66], 'identity.': [68], 'identifies': [71], 'who': [72], 'based': [76], 'unique': [79], 'voiceprint': [80], 'from': [81], 'speech': [83], 'data.': [84], 'Voice': [85], 'Activity': [86], 'Detection': [87], '(VAD),': [88], 'Spectral': [89], 'Subtraction': [90], '(SS),': [91], 'Mel-Frequency': [92], 'Cepstrum': [93], 'Coefficient': [94], '(MFCC),': [95], 'Vector': [96, 126], 'Quantization': [97, 127], '(VQ),': [98], 'Dynamic': [99], 'Time': [100], 'Warping': [101], '(DTW)': [102], 'k-Nearest': [104], 'Neighbour': [105], '(k-NN)': [106], 'are': [107], 'methods': [108], 'used': [109], 'in': [110], 'part': [113], 'project': [116], 'implement': [118], 'using': [119], 'MATLAB': [120], 'software.': [121], 'For': [122], 'part,': [125], '(VQ)': [128], 'used.': [130], 'The': [131], 'rate': [133], 'for': [134, 146, 150], 'was': [141], 'successfully': [142], 'implemented': [143], '84.44%': [145], 'while': [149], '54.44%.': [154]}, 'cited_by_api_url': 'https://api.openalex.org/works?filter=cites:W3197877226', 'counts_by_year': [], 'updated_date': '2024-09-19T04:08:43.432073', 'created_date': '2021-09-13'}
Publication Information

Basic Information

Access and Citation

AI Researcher Chatbot

Primary Location

Authors

Topics

Keywords

Related Works