Hybrid Parallel Programming on GPU Clusters

Chao‐Tung Yang; Chih-Lin Huang; Cheng-Fang Lin; T. Y. Chang
{'id': 'https://openalex.org/W2066208787', 'doi': 'https://doi.org/10.1109/ispa.2010.97', 'title': 'Hybrid Parallel Programming on GPU Clusters', 'display_name': 'Hybrid Parallel Programming on GPU Clusters', 'publication_year': 2010, 'publication_date': '2010-09-01', 'ids': {'openalex': 'https://openalex.org/W2066208787', 'doi': 'https://doi.org/10.1109/ispa.2010.97', 'mag': '2066208787'}, 'language': 'en', 'primary_location': {'is_oa': False, 'landing_page_url': 'https://doi.org/10.1109/ispa.2010.97', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}, 'type': 'article', 'type_crossref': 'proceedings-article', 'indexed_in': ['crossref'], 'open_access': {'is_oa': False, 'oa_status': 'closed', 'oa_url': None, 'any_repository_has_fulltext': False}, 'authorships': [{'author_position': 'first', 'author': {'id': 'https://openalex.org/A5031161487', 'display_name': 'Chao‐Tung Yang', 'orcid': 'https://orcid.org/0000-0002-9579-4426'}, 'institutions': [{'id': 'https://openalex.org/I169090423', 'display_name': 'Tunghai University', 'ror': 'https://ror.org/00zhvdn11', 'country_code': 'TW', 'type': 'education', 'lineage': ['https://openalex.org/I169090423']}], 'countries': ['TW'], 'is_corresponding': False, 'raw_author_name': 'Chao-Tung Yang', 'raw_affiliation_strings': ['[Dept. of Comput. Sci., Tunghai Univ., Taichung, Taiwan]'], 'affiliations': [{'raw_affiliation_string': '[Dept. of Comput. Sci., Tunghai Univ., Taichung, Taiwan]', 'institution_ids': ['https://openalex.org/I169090423']}]}, {'author_position': 'middle', 'author': {'id': 'https://openalex.org/A5006779150', 'display_name': 'Chih-Lin Huang', 'orcid': None}, 'institutions': [{'id': 'https://openalex.org/I169090423', 'display_name': 'Tunghai University', 'ror': 'https://ror.org/00zhvdn11', 'country_code': 'TW', 'type': 'education', 'lineage': ['https://openalex.org/I169090423']}], 'countries': ['TW'], 'is_corresponding': False, 'raw_author_name': 'Chih-Lin Huang', 'raw_affiliation_strings': ['[Dept. of Comput. Sci., Tunghai Univ., Taichung, Taiwan]'], 'affiliations': [{'raw_affiliation_string': '[Dept. of Comput. Sci., Tunghai Univ., Taichung, Taiwan]', 'institution_ids': ['https://openalex.org/I169090423']}]}, {'author_position': 'middle', 'author': {'id': 'https://openalex.org/A5026853569', 'display_name': 'Cheng-Fang Lin', 'orcid': None}, 'institutions': [{'id': 'https://openalex.org/I169090423', 'display_name': 'Tunghai University', 'ror': 'https://ror.org/00zhvdn11', 'country_code': 'TW', 'type': 'education', 'lineage': ['https://openalex.org/I169090423']}], 'countries': ['TW'], 'is_corresponding': False, 'raw_author_name': 'Cheng-Fang Lin', 'raw_affiliation_strings': ['[Dept. of Comput. Sci., Tunghai Univ., Taichung, Taiwan]'], 'affiliations': [{'raw_affiliation_string': '[Dept. of Comput. Sci., Tunghai Univ., Taichung, Taiwan]', 'institution_ids': ['https://openalex.org/I169090423']}]}, {'author_position': 'last', 'author': {'id': 'https://openalex.org/A5055642272', 'display_name': 'T. Y. Chang', 'orcid': 'https://orcid.org/0009-0000-3943-6192'}, 'institutions': [{'id': 'https://openalex.org/I169090423', 'display_name': 'Tunghai University', 'ror': 'https://ror.org/00zhvdn11', 'country_code': 'TW', 'type': 'education', 'lineage': ['https://openalex.org/I169090423']}], 'countries': ['TW'], 'is_corresponding': False, 'raw_author_name': 'Tzu-Chieh Chang', 'raw_affiliation_strings': ['[Dept. of Comput. Sci., Tunghai Univ., Taichung, Taiwan]'], 'affiliations': [{'raw_affiliation_string': '[Dept. of Comput. Sci., Tunghai Univ., Taichung, Taiwan]', 'institution_ids': ['https://openalex.org/I169090423']}]}], 'countries_distinct_count': 1, 'institutions_distinct_count': 1, 'corresponding_author_ids': [], 'corresponding_institution_ids': [], 'apc_list': None, 'apc_paid': None, 'fwci': 0.835, 'has_fulltext': True, 'fulltext_origin': 'ngrams', 'cited_by_count': 7, 'citation_normalized_percentile': {'value': 0.600698, 'is_in_top_1_percent': False, 'is_in_top_10_percent': False}, 'cited_by_percentile_year': {'min': 82, 'max': 83}, 'biblio': {'volume': None, 'issue': None, 'first_page': None, 'last_page': None}, 'is_retracted': False, 'is_paratext': False, 'primary_topic': {'id': 'https://openalex.org/T10054', 'display_name': 'Parallel Computing and Performance Optimization', 'score': 1.0, 'subfield': {'id': 'https://openalex.org/subfields/1708', 'display_name': 'Hardware and Architecture'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, 'topics': [{'id': 'https://openalex.org/T10054', 'display_name': 'Parallel Computing and Performance Optimization', 'score': 1.0, 'subfield': {'id': 'https://openalex.org/subfields/1708', 'display_name': 'Hardware and Architecture'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10829', 'display_name': 'Networks on Chip in System-on-Chip Design', 'score': 0.999, 'subfield': {'id': 'https://openalex.org/subfields/1705', 'display_name': 'Computer Networks and Communications'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10715', 'display_name': 'Distributed Grid Computing Systems', 'score': 0.999, 'subfield': {'id': 'https://openalex.org/subfields/1705', 'display_name': 'Computer Networks and Communications'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}], 'keywords': [{'id': 'https://openalex.org/keywords/gpu-computing', 'display_name': 'GPU Computing', 'score': 0.629878}, {'id': 'https://openalex.org/keywords/parallel-computing', 'display_name': 'Parallel Computing', 'score': 0.617867}, {'id': 'https://openalex.org/keywords/multicore-architectures', 'display_name': 'Multicore Architectures', 'score': 0.553367}, {'id': 'https://openalex.org/keywords/grid-computing', 'display_name': 'Grid Computing', 'score': 0.527591}, {'id': 'https://openalex.org/keywords/task-scheduling', 'display_name': 'Task Scheduling', 'score': 0.526888}, {'id': 'https://openalex.org/keywords/gpu-cluster', 'display_name': 'GPU cluster', 'score': 0.51866925}, {'id': 'https://openalex.org/keywords/multi-core-processor', 'display_name': 'Multi-core processor', 'score': 0.4835953}, {'id': 'https://openalex.org/keywords/memory-hierarchy', 'display_name': 'Memory hierarchy', 'score': 0.44560304}, {'id': 'https://openalex.org/keywords/parallel-programming-model', 'display_name': 'Parallel programming model', 'score': 0.433639}], 'concepts': [{'id': 'https://openalex.org/C2778119891', 'wikidata': 'https://www.wikidata.org/wiki/Q477690', 'display_name': 'CUDA', 'level': 2, 'score': 0.91358995}, {'id': 'https://openalex.org/C41008148', 'wikidata': 'https://www.wikidata.org/wiki/Q21198', 'display_name': 'Computer science', 'level': 0, 'score': 0.8718909}, {'id': 'https://openalex.org/C173608175', 'wikidata': 'https://www.wikidata.org/wiki/Q232661', 'display_name': 'Parallel computing', 'level': 1, 'score': 0.8574493}, {'id': 'https://openalex.org/C138101251', 'wikidata': 'https://www.wikidata.org/wiki/Q213092', 'display_name': 'Thread (computing)', 'level': 2, 'score': 0.6233289}, {'id': 'https://openalex.org/C34165917', 'wikidata': 'https://www.wikidata.org/wiki/Q188267', 'display_name': 'Programming paradigm', 'level': 2, 'score': 0.60734165}, {'id': 'https://openalex.org/C48044578', 'wikidata': 'https://www.wikidata.org/wiki/Q727490', 'display_name': 'Scalability', 'level': 2, 'score': 0.5941496}, {'id': 'https://openalex.org/C2778787235', 'wikidata': 'https://www.wikidata.org/wiki/Q49007', 'display_name': 'Yarn', 'level': 2, 'score': 0.55165535}, {'id': 'https://openalex.org/C2781335571', 'wikidata': 'https://www.wikidata.org/wiki/Q2633544', 'display_name': 'GPU cluster', 'level': 3, 'score': 0.51866925}, {'id': 'https://openalex.org/C78766204', 'wikidata': 'https://www.wikidata.org/wiki/Q555032', 'display_name': 'Multi-core processor', 'level': 2, 'score': 0.4835953}, {'id': 'https://openalex.org/C42812', 'wikidata': 'https://www.wikidata.org/wiki/Q1082910', 'display_name': 'Partition (number theory)', 'level': 2, 'score': 0.48050654}, {'id': 'https://openalex.org/C50630238', 'wikidata': 'https://www.wikidata.org/wiki/Q971505', 'display_name': 'General-purpose computing on graphics processing units', 'level': 3, 'score': 0.47649282}, {'id': 'https://openalex.org/C2778100165', 'wikidata': 'https://www.wikidata.org/wiki/Q1589327', 'display_name': 'Memory hierarchy', 'level': 3, 'score': 0.44560304}, {'id': 'https://openalex.org/C137364921', 'wikidata': 'https://www.wikidata.org/wiki/Q27929394', 'display_name': 'Parallel programming model', 'level': 3, 'score': 0.433639}, {'id': 'https://openalex.org/C202491316', 'wikidata': 'https://www.wikidata.org/wiki/Q272683', 'display_name': 'Instruction set', 'level': 2, 'score': 0.4155542}, {'id': 'https://openalex.org/C21442007', 'wikidata': 'https://www.wikidata.org/wiki/Q1027879', 'display_name': 'Graphics', 'level': 2, 'score': 0.19205943}, {'id': 'https://openalex.org/C111919701', 'wikidata': 'https://www.wikidata.org/wiki/Q9135', 'display_name': 'Operating system', 'level': 1, 'score': 0.13003793}, {'id': 'https://openalex.org/C199360897', 'wikidata': 'https://www.wikidata.org/wiki/Q9143', 'display_name': 'Programming language', 'level': 1, 'score': 0.116961926}, {'id': 'https://openalex.org/C192562407', 'wikidata': 'https://www.wikidata.org/wiki/Q228736', 'display_name': 'Materials science', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C33923547', 'wikidata': 'https://www.wikidata.org/wiki/Q395', 'display_name': 'Mathematics', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C114614502', 'wikidata': 'https://www.wikidata.org/wiki/Q76592', 'display_name': 'Combinatorics', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C159985019', 'wikidata': 'https://www.wikidata.org/wiki/Q181790', 'display_name': 'Composite material', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C115537543', 'wikidata': 'https://www.wikidata.org/wiki/Q165596', 'display_name': 'Cache', 'level': 2, 'score': 0.0}], 'mesh': [], 'locations_count': 1, 'locations': [{'is_oa': False, 'landing_page_url': 'https://doi.org/10.1109/ispa.2010.97', 'pdf_url': None, 'source': None, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}], 'best_oa_location': None, 'sustainable_development_goals': [{'display_name': 'Industry, innovation and infrastructure', 'score': 0.43, 'id': 'https://metadata.un.org/sdg/9'}], 'grants': [], 'datasets': [], 'versions': [], 'referenced_works_count': 4, 'referenced_works': ['https://openalex.org/W1989216505', 'https://openalex.org/W2018270886', 'https://openalex.org/W2163798155', 'https://openalex.org/W2255551763'], 'related_works': ['https://openalex.org/W3156477716', 'https://openalex.org/W2783439599', 'https://openalex.org/W2294001614', 'https://openalex.org/W2117202926', 'https://openalex.org/W2070865675', 'https://openalex.org/W2066402492', 'https://openalex.org/W2066208787', 'https://openalex.org/W2023938924', 'https://openalex.org/W2008492897', 'https://openalex.org/W2005148983'], 'abstract_inverted_index': {'Nowadays,': [0], "NVIDIA's": [1], 'CUDA': [2, 59, 81, 121], 'is': [3], 'a': [4, 22, 74, 98], 'general': [5], 'purpose': [6], 'scalable': [7], 'parallel': [8, 14, 76, 119], 'programming': [9, 39, 77], 'model': [10, 33], 'for': [11], 'writing': [12], 'highly': [13], 'applications.': [15], 'It': [16], 'provides': [17], 'several': [18], 'key': [19], 'abstractions': [20], '-': [21], 'hierarchy': [23], 'of': [24, 49, 93, 103], 'thread': [25], 'blocks,': [26], 'shared': [27], 'memory,': [28], 'and': [29, 44, 54, 66, 82, 106], 'barrier': [30], 'synchronization.': [31], 'This': [32], 'has': [34], 'proven': [35], 'quite': [36], 'successful': [37], 'at': [38], 'multithreaded': [40], 'many': [41], 'core': [42], 'GPUs': [43], 'scales': [45], 'transparently': [46], 'to': [47, 60, 90, 112], 'hundreds': [48], 'cores:': [50], 'scientists': [51], 'throughout': [52], 'industry': [53], 'academia': [55], 'are': [56, 116], 'already': [57], 'using': [58, 79], 'achieve': [61], 'dramatic': [62], 'speedups': [63], 'on': [64], 'production': [65], 'research': [67], 'codes.': [68], 'In': [69], 'this': [70], 'paper,': [71], 'we': [72], 'propose': [73], 'hybrid': [75, 80], 'approach': [78], 'MPI': [83, 114], 'programming,': [84], 'which': [85, 101], 'partition': [86], 'loop': [87], 'iterations': [88, 110], 'according': [89], 'the': [91, 124, 128], 'number': [92], 'C1060': [94, 105], 'GPU': [95, 99], 'nodes': [96], 'in': [97, 118, 127], 'cluster': [100], 'consists': [102], 'one': [104, 107, 113], 'S1070.': [108], 'Loop': [109], 'assigned': [111], 'process': [115], 'processed': [117], 'by': [120, 123], 'run': [122], 'processor': [125], 'cores': [126], 'same': [129], 'computational': [130], 'node.': [131]}, 'cited_by_api_url': 'https://api.openalex.org/works?filter=cites:W2066208787', 'counts_by_year': [{'year': 2016, 'cited_by_count': 3}, {'year': 2013, 'cited_by_count': 2}, {'year': 2012, 'cited_by_count': 1}], 'updated_date': '2024-08-15T07:59:58.528780', 'created_date': '2016-06-24'}
Publication Information

Basic Information

Access and Citation

AI Researcher Chatbot

Primary Location

Authors

Topics

Keywords

Related Works