Splitting Long Input Sentences f or Phrase-based Statistical Machine Translation

Chooi-Ling Goh; Eiichiro Sumita
{'id': 'https://openalex.org/W2578428189', 'doi': None, 'title': 'Splitting Long Input Sentences f or Phrase-based Statistical Machine Translation', 'display_name': 'Splitting Long Input Sentences f or Phrase-based Statistical Machine Translation', 'publication_year': 2011, 'publication_date': '2011-01-01', 'ids': {'openalex': 'https://openalex.org/W2578428189', 'mag': '2578428189'}, 'language': 'en', 'primary_location': {'is_oa': False, 'landing_page_url': 'https://www.anlp.jp/proceedings/annual_meeting/2011/pdf_dir/D3-3.pdf', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}, 'type': 'article', 'type_crossref': 'journal-article', 'indexed_in': [], 'open_access': {'is_oa': False, 'oa_status': 'closed', 'oa_url': None, 'any_repository_has_fulltext': False}, 'authorships': [{'author_position': 'first', 'author': {'id': 'https://openalex.org/A5045669888', 'display_name': 'Chooi-Ling Goh', 'orcid': None}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'Chooi-Ling Goh', 'raw_affiliation_strings': [], 'affiliations': []}, {'author_position': 'last', 'author': {'id': 'https://openalex.org/A5033318800', 'display_name': 'Eiichiro Sumita', 'orcid': 'https://orcid.org/0000-0002-1028-4399'}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'Eiichiro Sumita', 'raw_affiliation_strings': [], 'affiliations': []}], 'institution_assertions': [], 'countries_distinct_count': 0, 'institutions_distinct_count': 0, 'corresponding_author_ids': [], 'corresponding_institution_ids': [], 'apc_list': None, 'apc_paid': None, 'fwci': 0.0, 'has_fulltext': False, 'cited_by_count': 0, 'citation_normalized_percentile': {'value': 0.0, 'is_in_top_1_percent': False, 'is_in_top_10_percent': False}, 'cited_by_percentile_year': {'min': 0, 'max': 65}, 'biblio': {'volume': None, 'issue': None, 'first_page': None, 'last_page': None}, 'is_retracted': False, 'is_paratext': False, 'primary_topic': {'id': 'https://openalex.org/T10181', 'display_name': 'Statistical Machine Translation and Natural Language Processing', 'score': 1.0, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, 'topics': [{'id': 'https://openalex.org/T10181', 'display_name': 'Statistical Machine Translation and Natural Language Processing', 'score': 1.0, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10028', 'display_name': 'Natural Language Processing', 'score': 0.9995, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T11550', 'display_name': 'Multi-label Text Classification in Machine Learning', 'score': 0.9791, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}], 'keywords': [{'id': 'https://openalex.org/keywords/phrase', 'display_name': 'Phrase', 'score': 0.7857379}, {'id': 'https://openalex.org/keywords/word-order', 'display_name': 'Word order', 'score': 0.6648151}, {'id': 'https://openalex.org/keywords/statistical-machine-translation', 'display_name': 'Statistical Machine Translation', 'score': 0.611658}, {'id': 'https://openalex.org/keywords/machine-translation', 'display_name': 'Machine Translation', 'score': 0.58698}, {'id': 'https://openalex.org/keywords/syntax-based-translation-models', 'display_name': 'Syntax-based Translation Models', 'score': 0.5676}, {'id': 'https://openalex.org/keywords/neural-machine-translation', 'display_name': 'Neural Machine Translation', 'score': 0.565099}, {'id': 'https://openalex.org/keywords/part-of-speech-tagging', 'display_name': 'Part-of-Speech Tagging', 'score': 0.547585}, {'id': 'https://openalex.org/keywords/word-error-rate', 'display_name': 'Word error rate', 'score': 0.46539247}, {'id': 'https://openalex.org/keywords/transfer-based-machine-translation', 'display_name': 'Transfer-based machine translation', 'score': 0.41419452}], 'concepts': [{'id': 'https://openalex.org/C41008148', 'wikidata': 'https://www.wikidata.org/wiki/Q21198', 'display_name': 'Computer science', 'level': 0, 'score': 0.798266}, {'id': 'https://openalex.org/C2776224158', 'wikidata': 'https://www.wikidata.org/wiki/Q187931', 'display_name': 'Phrase', 'level': 2, 'score': 0.7857379}, {'id': 'https://openalex.org/C203005215', 'wikidata': 'https://www.wikidata.org/wiki/Q79798', 'display_name': 'Machine translation', 'level': 2, 'score': 0.7787914}, {'id': 'https://openalex.org/C2777530160', 'wikidata': 'https://www.wikidata.org/wiki/Q41796', 'display_name': 'Sentence', 'level': 2, 'score': 0.7116691}, {'id': 'https://openalex.org/C204321447', 'wikidata': 'https://www.wikidata.org/wiki/Q30642', 'display_name': 'Natural language processing', 'level': 1, 'score': 0.70766735}, {'id': 'https://openalex.org/C149364088', 'wikidata': 'https://www.wikidata.org/wiki/Q185917', 'display_name': 'Translation (biology)', 'level': 4, 'score': 0.6997377}, {'id': 'https://openalex.org/C90805587', 'wikidata': 'https://www.wikidata.org/wiki/Q10944557', 'display_name': 'Word (group theory)', 'level': 2, 'score': 0.6960237}, {'id': 'https://openalex.org/C70777604', 'wikidata': 'https://www.wikidata.org/wiki/Q257885', 'display_name': 'Word order', 'level': 2, 'score': 0.6648151}, {'id': 'https://openalex.org/C154945302', 'wikidata': 'https://www.wikidata.org/wiki/Q11660', 'display_name': 'Artificial intelligence', 'level': 1, 'score': 0.63215286}, {'id': 'https://openalex.org/C24687705', 'wikidata': 'https://www.wikidata.org/wiki/Q3753284', 'display_name': 'Example-based machine translation', 'level': 3, 'score': 0.50141644}, {'id': 'https://openalex.org/C53893814', 'wikidata': 'https://www.wikidata.org/wiki/Q7378909', 'display_name': 'Rule-based machine translation', 'level': 2, 'score': 0.49804902}, {'id': 'https://openalex.org/C40969351', 'wikidata': 'https://www.wikidata.org/wiki/Q3516228', 'display_name': 'Word error rate', 'level': 2, 'score': 0.46539247}, {'id': 'https://openalex.org/C28490314', 'wikidata': 'https://www.wikidata.org/wiki/Q189436', 'display_name': 'Speech recognition', 'level': 1, 'score': 0.43376458}, {'id': 'https://openalex.org/C130597682', 'wikidata': 'https://www.wikidata.org/wiki/Q6961922', 'display_name': 'Transfer-based machine translation', 'level': 4, 'score': 0.41419452}, {'id': 'https://openalex.org/C41895202', 'wikidata': 'https://www.wikidata.org/wiki/Q8162', 'display_name': 'Linguistics', 'level': 1, 'score': 0.2585775}, {'id': 'https://openalex.org/C55493867', 'wikidata': 'https://www.wikidata.org/wiki/Q7094', 'display_name': 'Biochemistry', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C185592680', 'wikidata': 'https://www.wikidata.org/wiki/Q2329', 'display_name': 'Chemistry', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C138885662', 'wikidata': 'https://www.wikidata.org/wiki/Q5891', 'display_name': 'Philosophy', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C105580179', 'wikidata': 'https://www.wikidata.org/wiki/Q188928', 'display_name': 'Messenger RNA', 'level': 3, 'score': 0.0}, {'id': 'https://openalex.org/C104317684', 'wikidata': 'https://www.wikidata.org/wiki/Q7187', 'display_name': 'Gene', 'level': 2, 'score': 0.0}], 'mesh': [], 'locations_count': 1, 'locations': [{'is_oa': False, 'landing_page_url': 'https://www.anlp.jp/proceedings/annual_meeting/2011/pdf_dir/D3-3.pdf', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}], 'best_oa_location': None, 'sustainable_development_goals': [{'score': 0.64, 'id': 'https://metadata.un.org/sdg/4', 'display_name': 'Quality education'}], 'grants': [], 'datasets': [], 'versions': [], 'referenced_works_count': 6, 'referenced_works': ['https://openalex.org/W1501229393', 'https://openalex.org/W1792850142', 'https://openalex.org/W2060035243', 'https://openalex.org/W2104812589', 'https://openalex.org/W2138640103', 'https://openalex.org/W2143056968'], 'related_works': ['https://openalex.org/W3147450619', 'https://openalex.org/W3144853342', 'https://openalex.org/W2978725029', 'https://openalex.org/W2868859330', 'https://openalex.org/W2854083043', 'https://openalex.org/W2848184631', 'https://openalex.org/W2845266745', 'https://openalex.org/W2838613781', 'https://openalex.org/W2835233304', 'https://openalex.org/W2833566625', 'https://openalex.org/W2829852994', 'https://openalex.org/W2826163815', 'https://openalex.org/W2820009009', 'https://openalex.org/W2778778708', 'https://openalex.org/W2769293620', 'https://openalex.org/W2762827710', 'https://openalex.org/W2237031959', 'https://openalex.org/W2147912853', 'https://openalex.org/W2106498929', 'https://openalex.org/W2004326952'], 'abstract_inverted_index': {'Translation': [0], 'results': [1], 'suffer': [2], 'when': [3], 'a': [4, 32, 106], 'standard': [5], 'phrase-': [6], 'based': [7], 'statistical': [8], 'machine': [9], 'translation': [10, 19, 50, 137, 146], 'system': [11], 'is': [12, 34], 'used': [13], 'for': [14], 'translating': [15, 73], 'long': [16, 66], 'sentences.': [17], 'The': [18], 'output': [20], 'will': [21], 'not': [22, 55, 98], 'have': [23], 'the': [24, 29, 44, 49, 57, 65, 74, 84, 95, 100, 111, 117, 126, 144], 'same': [25], 'word': [26, 45, 85, 131, 164], 'order': [27, 121, 132], 'as': [28], 'source.': [30], 'When': [31], 'sentence': [33, 75], 'long,': [35], 'it': [36, 89], 'should': [37], 'be': [38, 92, 134], 'partitioned': [39], 'into': [40], 'several': [41], 'clauses,': [42, 54], 'and': [43, 72, 136, 163], 're-': [46], 'ordering': [47], 'during': [48], 'done': [51, 93], 'within': [52, 94], 'these': [53], 'between': [56, 99], 'clauses.': [58], 'In': [59, 79], 'this': [60], 'paper,': [61], 'we': [62, 82], 'propose': [63], 'splitting': [64], 'sentences': [67], 'using': [68], 'linguis-': [69], 'tic': [70], 'information,': [71], 'piece': [76], 'by': [77, 159], 'piece.': [78], 'other': [80], 'words,': [81], 'constrain': [83], 'reordering': [86], 'so': [87], 'that': [88], 'can': [90, 133], 'only': [91], 'pieces': [96, 112], 'but': [97], 'pieces.': [101], 'We': [102], 'then': [103], 'ap-': [104], 'ply': [105], 'language': [107], 'model': [108], 'to': [109, 122, 149, 153], 'join': [110], 'back': [113], 'to-': [114], 'gether': [115], 'in': [116, 120, 125], 'original': [118], 'sequence': [119], 'reduce': [123], 'disfluencies': [124], 'connection.': [127], 'By': [128], 'doing': [129], 'so,': [130], 'preserved': [135], 'quality': [138], 'im-': [139], 'proved.': [140], 'Our': [141], 'experiments': [142], 'on': [143], 'patent': [145], 'from': [147], 'Japanese': [148], 'English': [150], 'are': [151], 'able': [152], 'achieve': [154], 'bet-': [155], 'ter': [156], 'translations': [157], 'measured': [158], 'both': [160], 'BLEU': [161], 'score': [162], 'error': [165], 'rate': [166], '(WER).': [167]}, 'cited_by_api_url': 'https://api.openalex.org/works?filter=cites:W2578428189', 'counts_by_year': [], 'updated_date': '2024-09-19T00:49:56.048161', 'created_date': '2017-01-26'}
Publication Information

Basic Information

Access and Citation

AI Researcher Chatbot

Primary Location

Authors

Topics

Keywords

Related Works