Using hidden Markov model for information extraction based on multiple templates

Yunzhong Liu; Yaping Lin; Zhiping Chen
{'id': 'https://openalex.org/W2535856011', 'doi': 'https://doi.org/10.1109/nlpke.2003.1275937', 'title': 'Using hidden Markov model for information extraction based on multiple templates', 'display_name': 'Using hidden Markov model for information extraction based on multiple templates', 'publication_year': 2004, 'publication_date': '2004-07-08', 'ids': {'openalex': 'https://openalex.org/W2535856011', 'doi': 'https://doi.org/10.1109/nlpke.2003.1275937', 'mag': '2535856011'}, 'language': 'en', 'primary_location': {'is_oa': False, 'landing_page_url': 'https://doi.org/10.1109/nlpke.2003.1275937', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}, 'type': 'article', 'type_crossref': 'proceedings-article', 'indexed_in': ['crossref'], 'open_access': {'is_oa': False, 'oa_status': 'closed', 'oa_url': None, 'any_repository_has_fulltext': False}, 'authorships': [{'author_position': 'first', 'author': {'id': 'https://openalex.org/A5076110063', 'display_name': 'Yunzhong Liu', 'orcid': None}, 'institutions': [{'id': 'https://openalex.org/I16609230', 'display_name': 'Hunan University', 'ror': 'https://ror.org/05htk5m33', 'country_code': 'CN', 'type': 'education', 'lineage': ['https://openalex.org/I16609230']}], 'countries': ['CN'], 'is_corresponding': False, 'raw_author_name': 'None Yunzhong Liu', 'raw_affiliation_strings': ['College of Computer and Communication, Hunan University, Changsha, China'], 'affiliations': [{'raw_affiliation_string': 'College of Computer and Communication, Hunan University, Changsha, China', 'institution_ids': ['https://openalex.org/I16609230']}]}, {'author_position': 'middle', 'author': {'id': 'https://openalex.org/A5018617528', 'display_name': 'Yaping Lin', 'orcid': 'https://orcid.org/0000-0002-9052-9789'}, 'institutions': [{'id': 'https://openalex.org/I16609230', 'display_name': 'Hunan University', 'ror': 'https://ror.org/05htk5m33', 'country_code': 'CN', 'type': 'education', 'lineage': ['https://openalex.org/I16609230']}], 'countries': ['CN'], 'is_corresponding': False, 'raw_author_name': 'None Yaping Lin', 'raw_affiliation_strings': ['College of Computer and Communication, Hunan University, Changsha, China'], 'affiliations': [{'raw_affiliation_string': 'College of Computer and Communication, Hunan University, Changsha, China', 'institution_ids': ['https://openalex.org/I16609230']}]}, {'author_position': 'last', 'author': {'id': 'https://openalex.org/A5100667267', 'display_name': 'Zhiping Chen', 'orcid': 'https://orcid.org/0000-0003-4759-3774'}, 'institutions': [{'id': 'https://openalex.org/I16609230', 'display_name': 'Hunan University', 'ror': 'https://ror.org/05htk5m33', 'country_code': 'CN', 'type': 'education', 'lineage': ['https://openalex.org/I16609230']}], 'countries': ['CN'], 'is_corresponding': False, 'raw_author_name': 'None Zhiping Chen', 'raw_affiliation_strings': ['College of Computer and Communication, Hunan University, Changsha, China'], 'affiliations': [{'raw_affiliation_string': 'College of Computer and Communication, Hunan University, Changsha, China', 'institution_ids': ['https://openalex.org/I16609230']}]}], 'countries_distinct_count': 1, 'institutions_distinct_count': 1, 'corresponding_author_ids': [], 'corresponding_institution_ids': [], 'apc_list': None, 'apc_paid': None, 'fwci': 0.0, 'has_fulltext': True, 'fulltext_origin': 'ngrams', 'cited_by_count': 5, 'citation_normalized_percentile': {'value': 0.419046, 'is_in_top_1_percent': False, 'is_in_top_10_percent': False}, 'cited_by_percentile_year': {'min': 76, 'max': 77}, 'biblio': {'volume': None, 'issue': None, 'first_page': None, 'last_page': None}, 'is_retracted': False, 'is_paratext': False, 'primary_topic': {'id': 'https://openalex.org/T12016', 'display_name': 'Web Data Extraction and Crawling Techniques', 'score': 0.9998, 'subfield': {'id': 'https://openalex.org/subfields/1710', 'display_name': 'Information Systems'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, 'topics': [{'id': 'https://openalex.org/T12016', 'display_name': 'Web Data Extraction and Crawling Techniques', 'score': 0.9998, 'subfield': {'id': 'https://openalex.org/subfields/1710', 'display_name': 'Information Systems'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T11550', 'display_name': 'Multi-label Text Classification in Machine Learning', 'score': 0.9919, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T11269', 'display_name': 'Text Compression and Indexing Algorithms', 'score': 0.9916, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}], 'keywords': [{'id': 'https://openalex.org/keywords/template', 'display_name': 'Template', 'score': 0.75219214}, {'id': 'https://openalex.org/keywords/web-data-extraction', 'display_name': 'Web Data Extraction', 'score': 0.560404}, {'id': 'https://openalex.org/keywords/data-extraction', 'display_name': 'Data extraction', 'score': 0.52842265}, {'id': 'https://openalex.org/keywords/information-retrieval', 'display_name': 'Information Retrieval', 'score': 0.520468}, {'id': 'https://openalex.org/keywords/data-records-mining', 'display_name': 'Data Records Mining', 'score': 0.513116}, {'id': 'https://openalex.org/keywords/multi-label-learning', 'display_name': 'Multi-label Learning', 'score': 0.511529}, {'id': 'https://openalex.org/keywords/machine-learning-algorithms', 'display_name': 'Machine Learning Algorithms', 'score': 0.507261}, {'id': 'https://openalex.org/keywords/maximum-entropy-markov-model', 'display_name': 'Maximum-entropy Markov model', 'score': 0.5031337}], 'concepts': [{'id': 'https://openalex.org/C23224414', 'wikidata': 'https://www.wikidata.org/wiki/Q176769', 'display_name': 'Hidden Markov model', 'level': 2, 'score': 0.81702125}, {'id': 'https://openalex.org/C41008148', 'wikidata': 'https://www.wikidata.org/wiki/Q21198', 'display_name': 'Computer science', 'level': 0, 'score': 0.81653386}, {'id': 'https://openalex.org/C82714645', 'wikidata': 'https://www.wikidata.org/wiki/Q438331', 'display_name': 'Template', 'level': 2, 'score': 0.75219214}, {'id': 'https://openalex.org/C195807954', 'wikidata': 'https://www.wikidata.org/wiki/Q1662562', 'display_name': 'Information extraction', 'level': 2, 'score': 0.6463519}, {'id': 'https://openalex.org/C2780451532', 'wikidata': 'https://www.wikidata.org/wiki/Q759676', 'display_name': 'Task (project management)', 'level': 2, 'score': 0.5644399}, {'id': 'https://openalex.org/C154945302', 'wikidata': 'https://www.wikidata.org/wiki/Q11660', 'display_name': 'Artificial intelligence', 'level': 1, 'score': 0.5377531}, {'id': 'https://openalex.org/C2777466982', 'wikidata': 'https://www.wikidata.org/wiki/Q5227287', 'display_name': 'Data extraction', 'level': 3, 'score': 0.52842265}, {'id': 'https://openalex.org/C163836022', 'wikidata': 'https://www.wikidata.org/wiki/Q6771326', 'display_name': 'Markov model', 'level': 3, 'score': 0.5045136}, {'id': 'https://openalex.org/C196956702', 'wikidata': 'https://www.wikidata.org/wiki/Q6795829', 'display_name': 'Maximum-entropy Markov model', 'level': 5, 'score': 0.5031337}, {'id': 'https://openalex.org/C81669768', 'wikidata': 'https://www.wikidata.org/wiki/Q2359161', 'display_name': 'Precision and recall', 'level': 2, 'score': 0.49059787}, {'id': 'https://openalex.org/C67186912', 'wikidata': 'https://www.wikidata.org/wiki/Q367664', 'display_name': 'Data modeling', 'level': 2, 'score': 0.48265272}, {'id': 'https://openalex.org/C124101348', 'wikidata': 'https://www.wikidata.org/wiki/Q172491', 'display_name': 'Data mining', 'level': 1, 'score': 0.46262714}, {'id': 'https://openalex.org/C98763669', 'wikidata': 'https://www.wikidata.org/wiki/Q176645', 'display_name': 'Markov chain', 'level': 2, 'score': 0.4450968}, {'id': 'https://openalex.org/C153180895', 'wikidata': 'https://www.wikidata.org/wiki/Q7148389', 'display_name': 'Pattern recognition (psychology)', 'level': 2, 'score': 0.42915156}, {'id': 'https://openalex.org/C119857082', 'wikidata': 'https://www.wikidata.org/wiki/Q2539', 'display_name': 'Machine learning', 'level': 1, 'score': 0.39361924}, {'id': 'https://openalex.org/C54907487', 'wikidata': 'https://www.wikidata.org/wiki/Q7915688', 'display_name': 'Variable-order Markov model', 'level': 4, 'score': 0.31122118}, {'id': 'https://openalex.org/C77088390', 'wikidata': 'https://www.wikidata.org/wiki/Q8513', 'display_name': 'Database', 'level': 1, 'score': 0.10786325}, {'id': 'https://openalex.org/C187736073', 'wikidata': 'https://www.wikidata.org/wiki/Q2920921', 'display_name': 'Management', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C2779473830', 'wikidata': 'https://www.wikidata.org/wiki/Q1540899', 'display_name': 'MEDLINE', 'level': 2, 'score': 0.0}, {'id': 'https://openalex.org/C17744445', 'wikidata': 'https://www.wikidata.org/wiki/Q36442', 'display_name': 'Political science', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C199539241', 'wikidata': 'https://www.wikidata.org/wiki/Q7748', 'display_name': 'Law', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C162324750', 'wikidata': 'https://www.wikidata.org/wiki/Q8134', 'display_name': 'Economics', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C199360897', 'wikidata': 'https://www.wikidata.org/wiki/Q9143', 'display_name': 'Programming language', 'level': 1, 'score': 0.0}], 'mesh': [], 'locations_count': 1, 'locations': [{'is_oa': False, 'landing_page_url': 'https://doi.org/10.1109/nlpke.2003.1275937', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}], 'best_oa_location': None, 'sustainable_development_goals': [], 'grants': [], 'datasets': [], 'versions': [], 'referenced_works_count': 11, 'referenced_works': ['https://openalex.org/W1568339100', 'https://openalex.org/W1580375566', 'https://openalex.org/W1608864735', 'https://openalex.org/W1934019294', 'https://openalex.org/W197270748', 'https://openalex.org/W1999595522', 'https://openalex.org/W2125838338', 'https://openalex.org/W2145948275', 'https://openalex.org/W2162340487', 'https://openalex.org/W2168808732', 'https://openalex.org/W2373186028'], 'related_works': ['https://openalex.org/W3113307220', 'https://openalex.org/W2382132287', 'https://openalex.org/W2379333870', 'https://openalex.org/W2369742155', 'https://openalex.org/W2362196274', 'https://openalex.org/W2130519334', 'https://openalex.org/W2123012456', 'https://openalex.org/W2004087619', 'https://openalex.org/W1972679863', 'https://openalex.org/W1615861041'], 'abstract_inverted_index': {'Recent': [0], 'researches': [1], 'have': [2], 'demonstrated': [3], 'the': [4, 31, 50, 56, 69, 110, 118, 126, 136, 148, 152, 158], 'strong': [5], 'performance': [6], 'of': [7, 16], 'hidden': [8, 64, 97], 'Markov': [9, 65, 98], 'models': [10], 'applied': [11], 'to': [12, 62, 86], 'information': [13, 52, 101, 141], 'extraction-the': [14], 'task': [15], 'populating': [17], 'database': [18], 'slots': [19], 'with': [20], 'corresponding': [21], 'phrases': [22], 'from': [23, 35, 125, 135], 'text': [24], 'documents.': [25], 'It': [26], 'is': [27, 38, 59, 75, 79], 'well': [28], 'known': [29], 'that': [30, 147], 'training': [32, 57, 70, 111, 128, 138, 159], 'data': [33, 58, 71, 112, 129, 139, 160], 'coming': [34], 'different': [36, 40], 'sources': [37], 'probably': [39], 'in': [41, 164], 'their': [42, 45], 'formats': [43], 'although': [44], 'contents': [46], 'are': [47], 'similar.': [48], 'In': [49], 'previous': [51], 'extraction': [53, 102], 'researches,': [54], 'all': [55], 'mixed': [60], 'together': [61], 'learn': [63], 'model': [66, 89, 99, 122, 131], 'parameters.': [67, 90], 'But': [68], 'as': [72], 'a': [73, 93], 'whole': [74], 'multicomponent.': [76], 'And': [77], 'it': [78], 'difficult': [80], 'for': [81, 100, 140], 'using': [82, 96], 'statistical': [83], 'learning': [84], 'technique': [85], 'find': [87], 'optimal': [88], 'We': [91], 'present': [92], 'new': [94, 149], 'algorithm': [95, 150], 'based': [103, 116], 'on': [104, 117], 'multiple': [105, 114, 162], 'templates,': [106, 163], 'which': [107, 155], 'first': [108], 'clusters': [109], 'into': [113, 161], 'templates': [115], 'format,': [119], 'then': [120], 'learns': [121], 'structure': [123], 'parameters': [124, 134], 'clustered': [127, 157], 'and': [130, 167], 'emission': [132], 'probability': [133], 'initial': [137], 'extraction.': [142], 'The': [143], 'experimental': [144], 'results': [145], 'show': [146], 'outperforms': [151], 'original': [153], 'one,': [154], "hasn't": [156], 'both': [165], 'precision': [166], 'recall.': [168]}, 'cited_by_api_url': 'https://api.openalex.org/works?filter=cites:W2535856011', 'counts_by_year': [{'year': 2014, 'cited_by_count': 1}, {'year': 2013, 'cited_by_count': 1}], 'updated_date': '2024-09-12T15:43:59.118110', 'created_date': '2016-10-28'}
Publication Information

Basic Information

Access and Citation

AI Researcher Chatbot

Primary Location

Authors

Topics

Keywords

Related Works