Sentence segmentation using IBM word alignment model 1

Jia Xu; Richard Zens; Hermann Ney
{'id': 'https://openalex.org/W2352162662', 'doi': None, 'title': 'Sentence segmentation using IBM word alignment model 1', 'display_name': 'Sentence segmentation using IBM word alignment model 1', 'publication_year': 2005, 'publication_date': '2005-01-01', 'ids': {'openalex': 'https://openalex.org/W2352162662', 'mag': '2352162662'}, 'language': 'en', 'primary_location': {'is_oa': False, 'landing_page_url': 'https://www.aclweb.org/anthology/2005.eamt-1.37.pdf', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}, 'type': 'article', 'type_crossref': 'journal-article', 'indexed_in': [], 'open_access': {'is_oa': False, 'oa_status': 'closed', 'oa_url': None, 'any_repository_has_fulltext': False}, 'authorships': [{'author_position': 'first', 'author': {'id': 'https://openalex.org/A5100746379', 'display_name': 'Jia Xu', 'orcid': 'https://orcid.org/0000-0003-2422-4036'}, 'institutions': [{'id': 'https://openalex.org/I887968799', 'display_name': 'RWTH Aachen University', 'ror': 'https://ror.org/04xfq0f34', 'country_code': 'DE', 'type': 'education', 'lineage': ['https://openalex.org/I887968799']}], 'countries': ['DE'], 'is_corresponding': False, 'raw_author_name': 'Jia Xu', 'raw_affiliation_strings': ['RWTH Aachen University'], 'affiliations': [{'raw_affiliation_string': 'RWTH Aachen University', 'institution_ids': ['https://openalex.org/I887968799']}]}, {'author_position': 'middle', 'author': {'id': 'https://openalex.org/A5029127514', 'display_name': 'Richard Zens', 'orcid': None}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'Richard Zens', 'raw_affiliation_strings': [], 'affiliations': []}, {'author_position': 'last', 'author': {'id': 'https://openalex.org/A5087367411', 'display_name': 'Hermann Ney', 'orcid': None}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'Hermann Ney', 'raw_affiliation_strings': [], 'affiliations': []}], 'institution_assertions': [], 'countries_distinct_count': 1, 'institutions_distinct_count': 1, 'corresponding_author_ids': [], 'corresponding_institution_ids': [], 'apc_list': None, 'apc_paid': None, 'fwci': 4.087, 'has_fulltext': False, 'cited_by_count': 32, 'citation_normalized_percentile': {'value': 0.9129, 'is_in_top_1_percent': False, 'is_in_top_10_percent': True}, 'cited_by_percentile_year': {'min': 90, 'max': 91}, 'biblio': {'volume': None, 'issue': None, 'first_page': None, 'last_page': None}, 'is_retracted': False, 'is_paratext': False, 'primary_topic': {'id': 'https://openalex.org/T10181', 'display_name': 'Statistical Machine Translation and Natural Language Processing', 'score': 1.0, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, 'topics': [{'id': 'https://openalex.org/T10181', 'display_name': 'Statistical Machine Translation and Natural Language Processing', 'score': 1.0, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10028', 'display_name': 'Natural Language Processing', 'score': 0.9997, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T13629', 'display_name': 'Automatic Text Simplification and Readability Assessment', 'score': 0.991, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}], 'keywords': [{'id': 'https://openalex.org/keywords/language-modeling', 'display_name': 'Language Modeling', 'score': 0.56535}, {'id': 'https://openalex.org/keywords/machine-translation', 'display_name': 'Machine Translation', 'score': 0.561605}, {'id': 'https://openalex.org/keywords/statistical-machine-translation', 'display_name': 'Statistical Machine Translation', 'score': 0.559912}, {'id': 'https://openalex.org/keywords/syntax-based-translation-models', 'display_name': 'Syntax-based Translation Models', 'score': 0.553582}, {'id': 'https://openalex.org/keywords/topic-modeling', 'display_name': 'Topic Modeling', 'score': 0.553225}, {'id': 'https://openalex.org/keywords/ibm', 'display_name': 'IBM', 'score': 0.48871017}, {'id': 'https://openalex.org/keywords/text-segmentation', 'display_name': 'Text segmentation', 'score': 0.4119631}], 'concepts': [{'id': 'https://openalex.org/C41008148', 'wikidata': 'https://www.wikidata.org/wiki/Q21198', 'display_name': 'Computer science', 'level': 0, 'score': 0.8229135}, {'id': 'https://openalex.org/C203005215', 'wikidata': 'https://www.wikidata.org/wiki/Q79798', 'display_name': 'Machine translation', 'level': 2, 'score': 0.8026266}, {'id': 'https://openalex.org/C204321447', 'wikidata': 'https://www.wikidata.org/wiki/Q30642', 'display_name': 'Natural language processing', 'level': 1, 'score': 0.750151}, {'id': 'https://openalex.org/C154945302', 'wikidata': 'https://www.wikidata.org/wiki/Q11660', 'display_name': 'Artificial intelligence', 'level': 1, 'score': 0.7353784}, {'id': 'https://openalex.org/C2777530160', 'wikidata': 'https://www.wikidata.org/wiki/Q41796', 'display_name': 'Sentence', 'level': 2, 'score': 0.7077086}, {'id': 'https://openalex.org/C89600930', 'wikidata': 'https://www.wikidata.org/wiki/Q1423946', 'display_name': 'Segmentation', 'level': 2, 'score': 0.63359934}, {'id': 'https://openalex.org/C90805587', 'wikidata': 'https://www.wikidata.org/wiki/Q10944557', 'display_name': 'Word (group theory)', 'level': 2, 'score': 0.61397976}, {'id': 'https://openalex.org/C149364088', 'wikidata': 'https://www.wikidata.org/wiki/Q185917', 'display_name': 'Translation (biology)', 'level': 4, 'score': 0.58975625}, {'id': 'https://openalex.org/C2778121359', 'wikidata': 'https://www.wikidata.org/wiki/Q8096', 'display_name': 'Lexicon', 'level': 2, 'score': 0.49344245}, {'id': 'https://openalex.org/C28490314', 'wikidata': 'https://www.wikidata.org/wiki/Q189436', 'display_name': 'Speech recognition', 'level': 1, 'score': 0.48872542}, {'id': 'https://openalex.org/C70388272', 'wikidata': 'https://www.wikidata.org/wiki/Q5968558', 'display_name': 'IBM', 'level': 2, 'score': 0.48871017}, {'id': 'https://openalex.org/C28719098', 'wikidata': 'https://www.wikidata.org/wiki/Q44946', 'display_name': 'Point (geometry)', 'level': 2, 'score': 0.43551698}, {'id': 'https://openalex.org/C98501671', 'wikidata': 'https://www.wikidata.org/wiki/Q1948408', 'display_name': 'Text segmentation', 'level': 3, 'score': 0.4119631}, {'id': 'https://openalex.org/C41895202', 'wikidata': 'https://www.wikidata.org/wiki/Q8162', 'display_name': 'Linguistics', 'level': 1, 'score': 0.09469125}, {'id': 'https://openalex.org/C33923547', 'wikidata': 'https://www.wikidata.org/wiki/Q395', 'display_name': 'Mathematics', 'level': 0, 'score': 0.07628691}, {'id': 'https://openalex.org/C138885662', 'wikidata': 'https://www.wikidata.org/wiki/Q5891', 'display_name': 'Philosophy', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C55493867', 'wikidata': 'https://www.wikidata.org/wiki/Q7094', 'display_name': 'Biochemistry', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C185592680', 'wikidata': 'https://www.wikidata.org/wiki/Q2329', 'display_name': 'Chemistry', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C192562407', 'wikidata': 'https://www.wikidata.org/wiki/Q228736', 'display_name': 'Materials science', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C2524010', 'wikidata': 'https://www.wikidata.org/wiki/Q8087', 'display_name': 'Geometry', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C105580179', 'wikidata': 'https://www.wikidata.org/wiki/Q188928', 'display_name': 'Messenger RNA', 'level': 3, 'score': 0.0}, {'id': 'https://openalex.org/C104317684', 'wikidata': 'https://www.wikidata.org/wiki/Q7187', 'display_name': 'Gene', 'level': 2, 'score': 0.0}, {'id': 'https://openalex.org/C171250308', 'wikidata': 'https://www.wikidata.org/wiki/Q11468', 'display_name': 'Nanotechnology', 'level': 1, 'score': 0.0}], 'mesh': [], 'locations_count': 1, 'locations': [{'is_oa': False, 'landing_page_url': 'https://www.aclweb.org/anthology/2005.eamt-1.37.pdf', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}], 'best_oa_location': None, 'sustainable_development_goals': [{'score': 0.67, 'id': 'https://metadata.un.org/sdg/4', 'display_name': 'Quality education'}], 'grants': [], 'datasets': [], 'versions': [], 'referenced_works_count': 12, 'referenced_works': ['https://openalex.org/W181080099', 'https://openalex.org/W1819903106', 'https://openalex.org/W2006969979', 'https://openalex.org/W2038698865', 'https://openalex.org/W2042610879', 'https://openalex.org/W2078861931', 'https://openalex.org/W2101105183', 'https://openalex.org/W2117652747', 'https://openalex.org/W2119168550', 'https://openalex.org/W2156985047', 'https://openalex.org/W2158388102', 'https://openalex.org/W2168929382'], 'related_works': ['https://openalex.org/W3115991198', 'https://openalex.org/W2962879323', 'https://openalex.org/W2558155472', 'https://openalex.org/W2403038860', 'https://openalex.org/W222053410', 'https://openalex.org/W2170594493', 'https://openalex.org/W2157167255', 'https://openalex.org/W2156985047', 'https://openalex.org/W2153653739', 'https://openalex.org/W2146574666', 'https://openalex.org/W2144783305', 'https://openalex.org/W2124807415', 'https://openalex.org/W2115634880', 'https://openalex.org/W2101105183', 'https://openalex.org/W2078861931', 'https://openalex.org/W201459010', 'https://openalex.org/W2006969979', 'https://openalex.org/W165937378', 'https://openalex.org/W1631260214', 'https://openalex.org/W1489181569'], 'abstract_inverted_index': {'In': [0, 92], 'statistical': [1], 'machine': [2, 89], 'translation,': [3], 'word': [4, 29], 'alignment': [5], 'models': [6], 'are': [7], 'trained': [8], 'on': [9, 61], 'bilingual': [10], 'corpora.': [11], 'Long': [12], 'sentences': [13, 77], 'pose': [14], 'severe': [15], 'problems:': [16], '1.': [17], 'the': [18, 23, 27, 48, 53, 67, 73, 82, 95, 102], 'high': [19], 'computational': [20], 'requirements;': [21], '2.': [22], 'poor': [24], 'quality': [25, 85], 'of': [26, 75, 86, 94, 101, 105], 'resulting': [28], 'alignment.': [30], 'We': [31, 70], 'present': [32], 'a': [33, 87], 'sentence-segmentation': [34], 'method': [35, 58], 'that': [36, 72], 'solves': [37], 'these': [38], 'problems': [39], 'by': [40], 'splitting': [41], 'long': [42, 76], 'sentence': [43], 'pairs.': [44], 'Our': [45], 'approach': [46], 'uses': [47], 'lexicon': [49], 'information': [50], 'to': [51], 'locate': [52], 'optimal': [54], 'split': [55], 'point.': [56], 'This': [57], 'is': [59], 'evaluated': [60], 'two': [62], 'Chinese-English': [63], 'translation': [64, 84, 90], 'tasks': [65], 'in': [66], 'news': [68], 'domain.': [69], 'show': [71], 'segmentation': [74], 'before': [78], 'training': [79], 'significantly': [80], 'improves': [81], 'final': [83], 'state-of-the-art': [88], 'system.': [91], 'one': [93], 'tasks,': [96], 'we': [97], 'achieve': [98], 'an': [99], 'improvement': [100], 'BLEU': [103], 'score': [104], 'more': [106], 'than': [107], '20%': [108], 'relative.': [109]}, 'cited_by_api_url': 'https://api.openalex.org/works?filter=cites:W2352162662', 'counts_by_year': [{'year': 2019, 'cited_by_count': 1}, {'year': 2018, 'cited_by_count': 1}, {'year': 2017, 'cited_by_count': 1}, {'year': 2016, 'cited_by_count': 3}, {'year': 2015, 'cited_by_count': 5}, {'year': 2014, 'cited_by_count': 2}, {'year': 2013, 'cited_by_count': 2}, {'year': 2012, 'cited_by_count': 3}], 'updated_date': '2024-09-14T06:58:05.266076', 'created_date': '2016-06-24'}
Publication Information

Basic Information

Access and Citation

AI Researcher Chatbot

Primary Location

Authors

Topics

Keywords

Related Works