Incremental Training and Intentional Over-fitting of Word Alignment.

Qin Gao; William D. Lewis; Chris Quirk; Mei-Yuh Hwang
{'id': 'https://openalex.org/W169216084', 'doi': None, 'title': 'Incremental Training and Intentional Over-fitting of Word Alignment.', 'display_name': 'Incremental Training and Intentional Over-fitting of Word Alignment.', 'publication_year': 2011, 'publication_date': '2011-09-19', 'ids': {'openalex': 'https://openalex.org/W169216084', 'mag': '169216084'}, 'language': 'en', 'primary_location': {'is_oa': False, 'landing_page_url': 'https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/MT-Summit_Alignment.pdf', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}, 'type': 'article', 'type_crossref': 'journal-article', 'indexed_in': [], 'open_access': {'is_oa': False, 'oa_status': 'closed', 'oa_url': None, 'any_repository_has_fulltext': False}, 'authorships': [{'author_position': 'first', 'author': {'id': 'https://openalex.org/A5079489298', 'display_name': 'Qin Gao', 'orcid': 'https://orcid.org/0000-0002-0573-9774'}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'Qin Gao', 'raw_affiliation_strings': [], 'affiliations': []}, {'author_position': 'middle', 'author': {'id': 'https://openalex.org/A5014205123', 'display_name': 'William D. Lewis', 'orcid': 'https://orcid.org/0009-0009-7221-4749'}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'William Lewis', 'raw_affiliation_strings': [], 'affiliations': []}, {'author_position': 'middle', 'author': {'id': 'https://openalex.org/A5055734248', 'display_name': 'Chris Quirk', 'orcid': None}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'Chris Quirk', 'raw_affiliation_strings': [], 'affiliations': []}, {'author_position': 'last', 'author': {'id': 'https://openalex.org/A5030660132', 'display_name': 'Mei-Yuh Hwang', 'orcid': 'https://orcid.org/0009-0005-7296-0013'}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'Mei-Yuh Hwang', 'raw_affiliation_strings': [], 'affiliations': []}], 'countries_distinct_count': 0, 'institutions_distinct_count': 0, 'corresponding_author_ids': [], 'corresponding_institution_ids': [], 'apc_list': None, 'apc_paid': None, 'fwci': 0.837, 'has_fulltext': False, 'cited_by_count': 7, 'citation_normalized_percentile': {'value': 0.811409, 'is_in_top_1_percent': False, 'is_in_top_10_percent': False}, 'cited_by_percentile_year': {'min': 83, 'max': 84}, 'biblio': {'volume': None, 'issue': None, 'first_page': None, 'last_page': None}, 'is_retracted': False, 'is_paratext': False, 'primary_topic': {'id': 'https://openalex.org/T10181', 'display_name': 'Statistical Machine Translation and Natural Language Processing', 'score': 1.0, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, 'topics': [{'id': 'https://openalex.org/T10181', 'display_name': 'Statistical Machine Translation and Natural Language Processing', 'score': 1.0, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10028', 'display_name': 'Natural Language Processing', 'score': 0.9997, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10201', 'display_name': 'Speech Recognition Technology', 'score': 0.9798, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}], 'keywords': [{'id': 'https://openalex.org/keywords/machine-translation', 'display_name': 'Machine Translation', 'score': 0.575922}, {'id': 'https://openalex.org/keywords/language-modeling', 'display_name': 'Language Modeling', 'score': 0.566574}, {'id': 'https://openalex.org/keywords/topic-modeling', 'display_name': 'Topic Modeling', 'score': 0.560709}, {'id': 'https://openalex.org/keywords/neural-machine-translation', 'display_name': 'Neural Machine Translation', 'score': 0.556541}, {'id': 'https://openalex.org/keywords/syntax-based-translation-models', 'display_name': 'Syntax-based Translation Models', 'score': 0.551048}, {'id': 'https://openalex.org/keywords/baseline', 'display_name': 'Baseline (sea)', 'score': 0.5493391}, {'id': 'https://openalex.org/keywords/bleu', 'display_name': 'BLEU', 'score': 0.49979877}, {'id': 'https://openalex.org/keywords/training-set', 'display_name': 'Training set', 'score': 0.43310672}], 'concepts': [{'id': 'https://openalex.org/C41008148', 'wikidata': 'https://www.wikidata.org/wiki/Q21198', 'display_name': 'Computer science', 'level': 0, 'score': 0.7985939}, {'id': 'https://openalex.org/C90805587', 'wikidata': 'https://www.wikidata.org/wiki/Q10944557', 'display_name': 'Word (group theory)', 'level': 2, 'score': 0.69759727}, {'id': 'https://openalex.org/C203005215', 'wikidata': 'https://www.wikidata.org/wiki/Q79798', 'display_name': 'Machine translation', 'level': 2, 'score': 0.68548083}, {'id': 'https://openalex.org/C204321447', 'wikidata': 'https://www.wikidata.org/wiki/Q30642', 'display_name': 'Natural language processing', 'level': 1, 'score': 0.6461413}, {'id': 'https://openalex.org/C149364088', 'wikidata': 'https://www.wikidata.org/wiki/Q185917', 'display_name': 'Translation (biology)', 'level': 4, 'score': 0.6302888}, {'id': 'https://openalex.org/C154945302', 'wikidata': 'https://www.wikidata.org/wiki/Q11660', 'display_name': 'Artificial intelligence', 'level': 1, 'score': 0.62083805}, {'id': 'https://openalex.org/C12725497', 'wikidata': 'https://www.wikidata.org/wiki/Q810247', 'display_name': 'Baseline (sea)', 'level': 2, 'score': 0.5493391}, {'id': 'https://openalex.org/C622187', 'wikidata': 'https://www.wikidata.org/wiki/Q3500773', 'display_name': 'BLEU', 'level': 3, 'score': 0.49979877}, {'id': 'https://openalex.org/C2777211547', 'wikidata': 'https://www.wikidata.org/wiki/Q17141490', 'display_name': 'Training (meteorology)', 'level': 2, 'score': 0.4743544}, {'id': 'https://openalex.org/C51632099', 'wikidata': 'https://www.wikidata.org/wiki/Q3985153', 'display_name': 'Training set', 'level': 2, 'score': 0.43310672}, {'id': 'https://openalex.org/C42812', 'wikidata': 'https://www.wikidata.org/wiki/Q1082910', 'display_name': 'Partition (number theory)', 'level': 2, 'score': 0.4188348}, {'id': 'https://openalex.org/C28490314', 'wikidata': 'https://www.wikidata.org/wiki/Q189436', 'display_name': 'Speech recognition', 'level': 1, 'score': 0.39051375}, {'id': 'https://openalex.org/C33923547', 'wikidata': 'https://www.wikidata.org/wiki/Q395', 'display_name': 'Mathematics', 'level': 0, 'score': 0.095309585}, {'id': 'https://openalex.org/C55493867', 'wikidata': 'https://www.wikidata.org/wiki/Q7094', 'display_name': 'Biochemistry', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C185592680', 'wikidata': 'https://www.wikidata.org/wiki/Q2329', 'display_name': 'Chemistry', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C111368507', 'wikidata': 'https://www.wikidata.org/wiki/Q43518', 'display_name': 'Oceanography', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C2524010', 'wikidata': 'https://www.wikidata.org/wiki/Q8087', 'display_name': 'Geometry', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C121332964', 'wikidata': 'https://www.wikidata.org/wiki/Q413', 'display_name': 'Physics', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C114614502', 'wikidata': 'https://www.wikidata.org/wiki/Q76592', 'display_name': 'Combinatorics', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C105580179', 'wikidata': 'https://www.wikidata.org/wiki/Q188928', 'display_name': 'Messenger RNA', 'level': 3, 'score': 0.0}, {'id': 'https://openalex.org/C153294291', 'wikidata': 'https://www.wikidata.org/wiki/Q25261', 'display_name': 'Meteorology', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C104317684', 'wikidata': 'https://www.wikidata.org/wiki/Q7187', 'display_name': 'Gene', 'level': 2, 'score': 0.0}, {'id': 'https://openalex.org/C127313418', 'wikidata': 'https://www.wikidata.org/wiki/Q1069', 'display_name': 'Geology', 'level': 0, 'score': 0.0}], 'mesh': [], 'locations_count': 1, 'locations': [{'is_oa': False, 'landing_page_url': 'https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/MT-Summit_Alignment.pdf', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}], 'best_oa_location': None, 'sustainable_development_goals': [], 'grants': [], 'datasets': [], 'versions': [], 'referenced_works_count': 12, 'referenced_works': ['https://openalex.org/W1551202288', 'https://openalex.org/W2006969979', 'https://openalex.org/W2008225289', 'https://openalex.org/W2038698865', 'https://openalex.org/W2100969003', 'https://openalex.org/W2113541941', 'https://openalex.org/W2119168550', 'https://openalex.org/W2125838338', 'https://openalex.org/W2148861208', 'https://openalex.org/W2156985047', 'https://openalex.org/W2177801600', 'https://openalex.org/W2437005631'], 'related_works': ['https://openalex.org/W3197303984', 'https://openalex.org/W3177376359', 'https://openalex.org/W3158186976', 'https://openalex.org/W3103942011', 'https://openalex.org/W3030128163', 'https://openalex.org/W2971700495', 'https://openalex.org/W2963499882', 'https://openalex.org/W2856715283', 'https://openalex.org/W2490642139', 'https://openalex.org/W2399188371', 'https://openalex.org/W2352162662', 'https://openalex.org/W2219020585', 'https://openalex.org/W2156985047', 'https://openalex.org/W2152670447', 'https://openalex.org/W2124807415', 'https://openalex.org/W2110418293', 'https://openalex.org/W2104803517', 'https://openalex.org/W2101105183', 'https://openalex.org/W2056970273', 'https://openalex.org/W1742951243'], 'abstract_inverted_index': {'We': [0], 'investigate': [1], 'two': [2], 'problems': [3], 'in': [4], 'word': [5, 16, 31, 99], 'alignment': [6, 17, 32, 88, 100], 'for': [7, 14, 21, 40, 59], 'machine': [8, 23, 126], 'translation.': [9], 'First,': [10], 'we': [11, 55, 82, 123], 'compare': [12], 'methods': [13, 27], 'incremental': [15, 91, 118], 'to': [18, 73, 120], 'save': [19], 'time': [20], 'large-scale': [22], 'translation': [24, 53, 127], 'systems.': [25], 'Various': [26], 'of': [28, 62, 86], 'using': [29], 'existing': [30], 'models': [33], 'trained': [34], 'on': [35, 79, 102], 'a': [36, 97], 'larger,': [37], 'general': [38, 98], 'corpus': [39, 105, 111], 'incrementally': [41], 'aligning': [42], 'smaller': [43], 'new': [44], 'corpora': [45], 'are': [46, 68], 'compared.': [47], 'In': [48], 'addition,': [49], 'by': [50, 116, 131], 'training': [51, 92, 96, 119], 'separate': [52], 'tables,': [54], 'eliminate': [56], 'the': [57, 63, 74, 84, 103, 109], 'need': [58], 'any': [60], 're-processing': [61], 'baseline': [64, 75], 'data.': [65], 'Experimental': [66], 'results': [67], 'comparable': [69], 'or': [70], 'even': [71], 'superior': [72], 'batch-mode': [76], 'training.': [77], 'Based': [78], 'this': [80], 'success,': [81], 'explore': [83], 'possibility': [85], 'sharpening': [87], 'model': [89, 101], 'via': [90], 'scheme.': [93], 'By': [94], 'first': [95], 'whole': [104], 'and': [106], 'then': [107], 'dividing': [108], 'same': [110], 'into': [112], 'domainspecific': [113], 'partitions,': [114], 'followed': [115], 'applying': [117], 'each': [121], 'partition,': [122], 'can': [124], 'improve': [125], 'quality': [128], 'as': [129], 'measured': [130], 'BLEU.': [132]}, 'cited_by_api_url': 'https://api.openalex.org/works?filter=cites:W169216084', 'counts_by_year': [{'year': 2017, 'cited_by_count': 2}, {'year': 2016, 'cited_by_count': 1}, {'year': 2015, 'cited_by_count': 2}, {'year': 2013, 'cited_by_count': 1}, {'year': 2012, 'cited_by_count': 1}], 'updated_date': '2024-09-11T03:46:48.768021', 'created_date': '2016-06-24'}
Publication Information

Basic Information

Access and Citation

AI Researcher Chatbot

Primary Location

Authors

Topics

Keywords

Related Works