Named entity discovery using comparable news articles

Yusuke Shinyama; Satoshi Sekine
{'id': 'https://openalex.org/W2155874911', 'doi': 'https://doi.org/10.3115/1220355.1220477', 'title': 'Named entity discovery using comparable news articles', 'display_name': 'Named entity discovery using comparable news articles', 'publication_year': 2004, 'publication_date': '2004-01-01', 'ids': {'openalex': 'https://openalex.org/W2155874911', 'doi': 'https://doi.org/10.3115/1220355.1220477', 'mag': '2155874911'}, 'language': 'en', 'primary_location': {'is_oa': True, 'landing_page_url': 'https://doi.org/10.3115/1220355.1220477', 'pdf_url': 'https://dl.acm.org/doi/pdf/10.3115/1220355.1220477', 'source': None, 'license': None, 'license_id': None, 'version': 'publishedVersion', 'is_accepted': True, 'is_published': True}, 'type': 'article', 'type_crossref': 'proceedings-article', 'indexed_in': ['crossref'], 'open_access': {'is_oa': True, 'oa_status': 'bronze', 'oa_url': 'https://dl.acm.org/doi/pdf/10.3115/1220355.1220477', 'any_repository_has_fulltext': True}, 'authorships': [{'author_position': 'first', 'author': {'id': 'https://openalex.org/A5044614447', 'display_name': 'Yusuke Shinyama', 'orcid': None}, 'institutions': [{'id': 'https://openalex.org/I57206974', 'display_name': 'New York University', 'ror': 'https://ror.org/0190ak572', 'country_code': 'US', 'type': 'education', 'lineage': ['https://openalex.org/I57206974']}], 'countries': ['US'], 'is_corresponding': False, 'raw_author_name': 'Yusuke Shinyama', 'raw_affiliation_strings': ['New York University, New York, NY'], 'affiliations': [{'raw_affiliation_string': 'New York University, New York, NY', 'institution_ids': ['https://openalex.org/I57206974']}]}, {'author_position': 'last', 'author': {'id': 'https://openalex.org/A5043482117', 'display_name': 'Satoshi Sekine', 'orcid': 'https://orcid.org/0000-0002-6951-4769'}, 'institutions': [{'id': 'https://openalex.org/I57206974', 'display_name': 'New York University', 'ror': 'https://ror.org/0190ak572', 'country_code': 'US', 'type': 'education', 'lineage': ['https://openalex.org/I57206974']}], 'countries': ['US'], 'is_corresponding': False, 'raw_author_name': 'Satoshi Sekine', 'raw_affiliation_strings': ['New York University, New York, NY'], 'affiliations': [{'raw_affiliation_string': 'New York University, New York, NY', 'institution_ids': ['https://openalex.org/I57206974']}]}], 'institution_assertions': [], 'countries_distinct_count': 1, 'institutions_distinct_count': 1, 'corresponding_author_ids': [], 'corresponding_institution_ids': [], 'apc_list': None, 'apc_paid': None, 'fwci': 2.206, 'has_fulltext': True, 'fulltext_origin': 'pdf', 'cited_by_count': 77, 'citation_normalized_percentile': {'value': 0.946897, 'is_in_top_1_percent': False, 'is_in_top_10_percent': True}, 'cited_by_percentile_year': {'min': 95, 'max': 96}, 'biblio': {'volume': None, 'issue': None, 'first_page': None, 'last_page': None}, 'is_retracted': False, 'is_paratext': False, 'primary_topic': {'id': 'https://openalex.org/T10028', 'display_name': 'Natural Language Processing', 'score': 0.9998, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, 'topics': [{'id': 'https://openalex.org/T10028', 'display_name': 'Natural Language Processing', 'score': 0.9998, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10181', 'display_name': 'Statistical Machine Translation and Natural Language Processing', 'score': 0.9996, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T12016', 'display_name': 'Web Data Extraction and Crawling Techniques', 'score': 0.9965, 'subfield': {'id': 'https://openalex.org/subfields/1710', 'display_name': 'Information Systems'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}], 'keywords': [{'id': 'https://openalex.org/keywords/entity-linking', 'display_name': 'Entity linking', 'score': 0.82354456}, {'id': 'https://openalex.org/keywords/named-entity', 'display_name': 'Named entity', 'score': 0.81074816}, {'id': 'https://openalex.org/keywords/named-entity-recognition', 'display_name': 'Named Entity Recognition', 'score': 0.664786}, {'id': 'https://openalex.org/keywords/semantic-similarity', 'display_name': 'Semantic Similarity', 'score': 0.536378}, {'id': 'https://openalex.org/keywords/part-of-speech-tagging', 'display_name': 'Part-of-Speech Tagging', 'score': 0.514516}, {'id': 'https://openalex.org/keywords/topic-modeling', 'display_name': 'Topic Modeling', 'score': 0.50141}, {'id': 'https://openalex.org/keywords/proper-noun', 'display_name': 'Proper noun', 'score': 0.42662415}], 'concepts': [{'id': 'https://openalex.org/C2779135771', 'wikidata': 'https://www.wikidata.org/wiki/Q403574', 'display_name': 'Named-entity recognition', 'level': 3, 'score': 0.88128626}, {'id': 'https://openalex.org/C96711827', 'wikidata': 'https://www.wikidata.org/wiki/Q17012245', 'display_name': 'Entity linking', 'level': 3, 'score': 0.82354456}, {'id': 'https://openalex.org/C41008148', 'wikidata': 'https://www.wikidata.org/wiki/Q21198', 'display_name': 'Computer science', 'level': 0, 'score': 0.8155842}, {'id': 'https://openalex.org/C2777889803', 'wikidata': 'https://www.wikidata.org/wiki/Q25047676', 'display_name': 'Named entity', 'level': 2, 'score': 0.81074816}, {'id': 'https://openalex.org/C204321447', 'wikidata': 'https://www.wikidata.org/wiki/Q30642', 'display_name': 'Natural language processing', 'level': 1, 'score': 0.67665035}, {'id': 'https://openalex.org/C201280247', 'wikidata': 'https://www.wikidata.org/wiki/Q11032', 'display_name': 'Newspaper', 'level': 2, 'score': 0.6316329}, {'id': 'https://openalex.org/C81669768', 'wikidata': 'https://www.wikidata.org/wiki/Q2359161', 'display_name': 'Precision and recall', 'level': 2, 'score': 0.5847925}, {'id': 'https://openalex.org/C154945302', 'wikidata': 'https://www.wikidata.org/wiki/Q11660', 'display_name': 'Artificial intelligence', 'level': 1, 'score': 0.5641013}, {'id': 'https://openalex.org/C2780451532', 'wikidata': 'https://www.wikidata.org/wiki/Q759676', 'display_name': 'Task (project management)', 'level': 2, 'score': 0.5487602}, {'id': 'https://openalex.org/C100660578', 'wikidata': 'https://www.wikidata.org/wiki/Q18733', 'display_name': 'Recall', 'level': 2, 'score': 0.54506177}, {'id': 'https://openalex.org/C23123220', 'wikidata': 'https://www.wikidata.org/wiki/Q816826', 'display_name': 'Information retrieval', 'level': 1, 'score': 0.5257966}, {'id': 'https://openalex.org/C90805587', 'wikidata': 'https://www.wikidata.org/wiki/Q10944557', 'display_name': 'Word (group theory)', 'level': 2, 'score': 0.5215228}, {'id': 'https://openalex.org/C195324797', 'wikidata': 'https://www.wikidata.org/wiki/Q33742', 'display_name': 'Natural language', 'level': 2, 'score': 0.448039}, {'id': 'https://openalex.org/C121934690', 'wikidata': 'https://www.wikidata.org/wiki/Q1084', 'display_name': 'Noun', 'level': 2, 'score': 0.43434718}, {'id': 'https://openalex.org/C41417386', 'wikidata': 'https://www.wikidata.org/wiki/Q147276', 'display_name': 'Proper noun', 'level': 2, 'score': 0.42662415}, {'id': 'https://openalex.org/C41895202', 'wikidata': 'https://www.wikidata.org/wiki/Q8162', 'display_name': 'Linguistics', 'level': 1, 'score': 0.17901936}, {'id': 'https://openalex.org/C4554734', 'wikidata': 'https://www.wikidata.org/wiki/Q593744', 'display_name': 'Knowledge base', 'level': 2, 'score': 0.15467024}, {'id': 'https://openalex.org/C138885662', 'wikidata': 'https://www.wikidata.org/wiki/Q5891', 'display_name': 'Philosophy', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C144133560', 'wikidata': 'https://www.wikidata.org/wiki/Q4830453', 'display_name': 'Business', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C187736073', 'wikidata': 'https://www.wikidata.org/wiki/Q2920921', 'display_name': 'Management', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C112698675', 'wikidata': 'https://www.wikidata.org/wiki/Q37038', 'display_name': 'Advertising', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C162324750', 'wikidata': 'https://www.wikidata.org/wiki/Q8134', 'display_name': 'Economics', 'level': 0, 'score': 0.0}], 'mesh': [], 'locations_count': 1, 'locations': [{'is_oa': True, 'landing_page_url': 'https://doi.org/10.3115/1220355.1220477', 'pdf_url': 'https://dl.acm.org/doi/pdf/10.3115/1220355.1220477', 'source': None, 'license': None, 'license_id': None, 'version': 'publishedVersion', 'is_accepted': True, 'is_published': True}], 'best_oa_location': {'is_oa': True, 'landing_page_url': 'https://doi.org/10.3115/1220355.1220477', 'pdf_url': 'https://dl.acm.org/doi/pdf/10.3115/1220355.1220477', 'source': None, 'license': None, 'license_id': None, 'version': 'publishedVersion', 'is_accepted': True, 'is_published': True}, 'sustainable_development_goals': [{'score': 0.76, 'id': 'https://metadata.un.org/sdg/4', 'display_name': 'Quality education'}], 'grants': [], 'datasets': [], 'versions': [], 'referenced_works_count': 8, 'referenced_works': ['https://openalex.org/W102026425', 'https://openalex.org/W178774507', 'https://openalex.org/W1964719994', 'https://openalex.org/W1969655345', 'https://openalex.org/W2107130271', 'https://openalex.org/W2134368421', 'https://openalex.org/W2785349534', 'https://openalex.org/W4238910897'], 'related_works': ['https://openalex.org/W69953359', 'https://openalex.org/W4253099099', 'https://openalex.org/W4239111889', 'https://openalex.org/W3144742264', 'https://openalex.org/W2593907245', 'https://openalex.org/W2405038964', 'https://openalex.org/W2252245846', 'https://openalex.org/W2155874911', 'https://openalex.org/W2075635421', 'https://openalex.org/W1978990931'], 'abstract_inverted_index': {'In': [0], 'this': [1, 64, 98], 'paper': [2], 'we': [3, 66, 95], 'describe': [4], 'a': [5, 44, 57, 82, 109], 'way': [6], 'to': [7, 49, 103], 'discover': [8], 'Named': [9, 20, 45, 70, 110], 'Entities': [10, 71], 'by': [11, 76], 'using': [12], 'the': [13, 88, 105], 'distribution': [14], 'of': [15, 81, 108], 'words': [16], 'in': [17, 52, 84], 'news': [18, 54], 'articles.': [19], 'Entity': [21, 46, 111], 'recognition': [22], 'is': [23, 47, 60, 91], 'an': [24, 41], 'important': [25], 'task': [26], 'for': [27], "today's": [28], 'natural': [29], 'language': [30], 'applications,': [31], 'but': [32], 'it': [33], 'still': [34], 'suffers': [35], 'from': [36], 'data': [37], 'sparseness.': [38], 'We': [39], 'used': [40, 102], 'observation': [42], 'that': [43, 97], 'likely': [48], 'appear': [50], 'synchronously': [51], 'several': [53], 'articles,': [55], 'whereas': [56], 'common': [58], 'noun': [59], 'less': [61], 'likely.': [62], 'Exploiting': [63], 'characteristic,': [65], 'successfully': [67], 'obtained': [68], 'rare': [69], 'with': [72], '90%': [73], 'accuracy': [74], 'just': [75], 'comparing': [77], 'time': [78], 'series': [79], 'distributions': [80], 'word': [83], 'two': [85], 'newspapers.': [86], 'Although': [87], 'achieved': [89], 'recall': [90], 'not': [92], 'sufficient': [93], 'yet,': [94], 'believe': [96], 'method': [99], 'can': [100], 'be': [101], 'strengthen': [104], 'lexical': [106], 'knowledge': [107], 'tagger.': [112]}, 'cited_by_api_url': 'https://api.openalex.org/works?filter=cites:W2155874911', 'counts_by_year': [{'year': 2024, 'cited_by_count': 1}, {'year': 2023, 'cited_by_count': 2}, {'year': 2021, 'cited_by_count': 2}, {'year': 2020, 'cited_by_count': 1}, {'year': 2018, 'cited_by_count': 2}, {'year': 2017, 'cited_by_count': 3}, {'year': 2016, 'cited_by_count': 5}, {'year': 2015, 'cited_by_count': 6}, {'year': 2014, 'cited_by_count': 5}, {'year': 2013, 'cited_by_count': 11}, {'year': 2012, 'cited_by_count': 4}], 'updated_date': '2024-09-16T17:07:19.575194', 'created_date': '2016-06-24'}
Publication Information

Basic Information

Access and Citation

AI Researcher Chatbot

Primary Location

Authors

Topics

Keywords

Related Works