Inner Loop Optimizations in Mapping Single Threaded Programs to Hardware

Madhav P. Desai
{'id': 'https://openalex.org/W30800889', 'doi': 'https://doi.org/10.48550/arxiv.1411.0863', 'title': 'Inner Loop Optimizations in Mapping Single Threaded Programs to Hardware', 'display_name': 'Inner Loop Optimizations in Mapping Single Threaded Programs to Hardware', 'publication_year': 2014, 'publication_date': '2014-01-01', 'ids': {'openalex': 'https://openalex.org/W30800889', 'doi': 'https://doi.org/10.48550/arxiv.1411.0863', 'mag': '30800889'}, 'language': 'en', 'primary_location': {'is_oa': True, 'landing_page_url': 'https://arxiv.org/abs/1411.0863', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S4306400194', 'display_name': 'arXiv (Cornell University)', 'issn_l': None, 'issn': None, 'is_oa': True, 'is_in_doaj': False, 'is_core': False, 'host_organization': 'https://openalex.org/I205783295', 'host_organization_name': 'Cornell University', 'host_organization_lineage': ['https://openalex.org/I205783295'], 'host_organization_lineage_names': ['Cornell University'], 'type': 'repository'}, 'license': 'other-oa', 'license_id': 'https://openalex.org/licenses/other-oa', 'version': 'submittedVersion', 'is_accepted': False, 'is_published': False}, 'type': 'preprint', 'type_crossref': 'posted-content', 'indexed_in': ['datacite'], 'open_access': {'is_oa': True, 'oa_status': 'green', 'oa_url': 'https://arxiv.org/abs/1411.0863', 'any_repository_has_fulltext': True}, 'authorships': [{'author_position': 'first', 'author': {'id': 'https://openalex.org/A5033005768', 'display_name': 'Madhav P. Desai', 'orcid': None}, 'institutions': [], 'countries': [], 'is_corresponding': True, 'raw_author_name': 'Madhav Desai', 'raw_affiliation_strings': [], 'affiliations': []}], 'institution_assertions': [], 'countries_distinct_count': 0, 'institutions_distinct_count': 0, 'corresponding_author_ids': ['https://openalex.org/A5033005768'], 'corresponding_institution_ids': [], 'apc_list': None, 'apc_paid': None, 'fwci': None, 'has_fulltext': False, 'cited_by_count': 0, 'citation_normalized_percentile': {'value': 0.0, 'is_in_top_1_percent': False, 'is_in_top_10_percent': False}, 'cited_by_percentile_year': {'min': 0, 'max': 66}, 'biblio': {'volume': None, 'issue': None, 'first_page': None, 'last_page': None}, 'is_retracted': False, 'is_paratext': False, 'primary_topic': {'id': 'https://openalex.org/T10054', 'display_name': 'Parallel Computing and Performance Optimization', 'score': 0.9998, 'subfield': {'id': 'https://openalex.org/subfields/1708', 'display_name': 'Hardware and Architecture'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, 'topics': [{'id': 'https://openalex.org/T10054', 'display_name': 'Parallel Computing and Performance Optimization', 'score': 0.9998, 'subfield': {'id': 'https://openalex.org/subfields/1708', 'display_name': 'Hardware and Architecture'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10904', 'display_name': 'Reconfigurable Computing Systems and Design Methods', 'score': 0.9993, 'subfield': {'id': 'https://openalex.org/subfields/1708', 'display_name': 'Hardware and Architecture'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10363', 'display_name': 'Low-Power VLSI Circuit Design and Optimization', 'score': 0.9982, 'subfield': {'id': 'https://openalex.org/subfields/2208', 'display_name': 'Electrical and Electronic Engineering'}, 'field': {'id': 'https://openalex.org/fields/22', 'display_name': 'Engineering'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}], 'keywords': [{'id': 'https://openalex.org/keywords/loop-unrolling', 'display_name': 'Loop unrolling', 'score': 0.9462286}, {'id': 'https://openalex.org/keywords/loop-tiling', 'display_name': 'Loop tiling', 'score': 0.8275362}, {'id': 'https://openalex.org/keywords/loop-fission', 'display_name': 'Loop fission', 'score': 0.8029919}, {'id': 'https://openalex.org/keywords/loop-fusion', 'display_name': 'Loop fusion', 'score': 0.69638675}, {'id': 'https://openalex.org/keywords/software-pipelining', 'display_name': 'Software pipelining', 'score': 0.5556179}, {'id': 'https://openalex.org/keywords/gpu-computing', 'display_name': 'GPU Computing', 'score': 0.540958}, {'id': 'https://openalex.org/keywords/inner-loop', 'display_name': 'Inner loop', 'score': 0.5255524}, {'id': 'https://openalex.org/keywords/performance-optimization', 'display_name': 'Performance Optimization', 'score': 0.52113}, {'id': 'https://openalex.org/keywords/multicore-architectures', 'display_name': 'Multicore Architectures', 'score': 0.516016}, {'id': 'https://openalex.org/keywords/parallel-computing', 'display_name': 'Parallel Computing', 'score': 0.513638}, {'id': 'https://openalex.org/keywords/high-performance-computing', 'display_name': 'High-Performance Computing', 'score': 0.508152}], 'concepts': [{'id': 'https://openalex.org/C76970557', 'wikidata': 'https://www.wikidata.org/wiki/Q1869750', 'display_name': 'Loop unrolling', 'level': 3, 'score': 0.9462286}, {'id': 'https://openalex.org/C11799548', 'wikidata': 'https://www.wikidata.org/wiki/Q6675847', 'display_name': 'Loop tiling', 'level': 3, 'score': 0.8275362}, {'id': 'https://openalex.org/C134718785', 'wikidata': 'https://www.wikidata.org/wiki/Q6675821', 'display_name': 'Loop fission', 'level': 3, 'score': 0.8029919}, {'id': 'https://openalex.org/C41008148', 'wikidata': 'https://www.wikidata.org/wiki/Q21198', 'display_name': 'Computer science', 'level': 0, 'score': 0.7861297}, {'id': 'https://openalex.org/C82653869', 'wikidata': 'https://www.wikidata.org/wiki/Q6675821', 'display_name': 'Loop fusion', 'level': 3, 'score': 0.69638675}, {'id': 'https://openalex.org/C173608175', 'wikidata': 'https://www.wikidata.org/wiki/Q232661', 'display_name': 'Parallel computing', 'level': 1, 'score': 0.6633866}, {'id': 'https://openalex.org/C184670325', 'wikidata': 'https://www.wikidata.org/wiki/Q512604', 'display_name': 'Loop (graph theory)', 'level': 2, 'score': 0.6046976}, {'id': 'https://openalex.org/C188854837', 'wikidata': 'https://www.wikidata.org/wiki/Q268469', 'display_name': 'Software pipelining', 'level': 3, 'score': 0.5556179}, {'id': 'https://openalex.org/C58716799', 'wikidata': 'https://www.wikidata.org/wiki/Q6035648', 'display_name': 'Inner loop', 'level': 3, 'score': 0.5255524}, {'id': 'https://openalex.org/C2779960059', 'wikidata': 'https://www.wikidata.org/wiki/Q7113681', 'display_name': 'Overhead (engineering)', 'level': 2, 'score': 0.4840664}, {'id': 'https://openalex.org/C42935608', 'wikidata': 'https://www.wikidata.org/wiki/Q190411', 'display_name': 'Field-programmable gate array', 'level': 2, 'score': 0.4395103}, {'id': 'https://openalex.org/C9390403', 'wikidata': 'https://www.wikidata.org/wiki/Q3966', 'display_name': 'Computer hardware', 'level': 1, 'score': 0.42572206}, {'id': 'https://openalex.org/C169590947', 'wikidata': 'https://www.wikidata.org/wiki/Q47506', 'display_name': 'Compiler', 'level': 2, 'score': 0.20284507}, {'id': 'https://openalex.org/C111919701', 'wikidata': 'https://www.wikidata.org/wiki/Q9135', 'display_name': 'Operating system', 'level': 1, 'score': 0.09819949}, {'id': 'https://openalex.org/C203479927', 'wikidata': 'https://www.wikidata.org/wiki/Q5165939', 'display_name': 'Controller (irrigation)', 'level': 2, 'score': 0.08385211}, {'id': 'https://openalex.org/C33923547', 'wikidata': 'https://www.wikidata.org/wiki/Q395', 'display_name': 'Mathematics', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C114614502', 'wikidata': 'https://www.wikidata.org/wiki/Q76592', 'display_name': 'Combinatorics', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C6557445', 'wikidata': 'https://www.wikidata.org/wiki/Q173113', 'display_name': 'Agronomy', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C86803240', 'wikidata': 'https://www.wikidata.org/wiki/Q420', 'display_name': 'Biology', 'level': 0, 'score': 0.0}], 'mesh': [], 'locations_count': 2, 'locations': [{'is_oa': True, 'landing_page_url': 'https://arxiv.org/abs/1411.0863', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S4306400194', 'display_name': 'arXiv (Cornell University)', 'issn_l': None, 'issn': None, 'is_oa': True, 'is_in_doaj': False, 'is_core': False, 'host_organization': 'https://openalex.org/I205783295', 'host_organization_name': 'Cornell University', 'host_organization_lineage': ['https://openalex.org/I205783295'], 'host_organization_lineage_names': ['Cornell University'], 'type': 'repository'}, 'license': 'other-oa', 'license_id': 'https://openalex.org/licenses/other-oa', 'version': 'submittedVersion', 'is_accepted': False, 'is_published': False}, {'is_oa': False, 'landing_page_url': 'https://api.datacite.org/dois/10.48550/arxiv.1411.0863', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S4393179698', 'display_name': 'DataCite API', 'issn_l': None, 'issn': None, 'is_oa': True, 'is_in_doaj': False, 'is_core': False, 'host_organization': 'https://openalex.org/I4210145204', 'host_organization_name': 'DataCite', 'host_organization_lineage': ['https://openalex.org/I4210145204'], 'host_organization_lineage_names': ['DataCite'], 'type': 'metadata'}, 'license': None, 'license_id': None, 'version': None}], 'best_oa_location': {'is_oa': True, 'landing_page_url': 'https://arxiv.org/abs/1411.0863', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S4306400194', 'display_name': 'arXiv (Cornell University)', 'issn_l': None, 'issn': None, 'is_oa': True, 'is_in_doaj': False, 'is_core': False, 'host_organization': 'https://openalex.org/I205783295', 'host_organization_name': 'Cornell University', 'host_organization_lineage': ['https://openalex.org/I205783295'], 'host_organization_lineage_names': ['Cornell University'], 'type': 'repository'}, 'license': 'other-oa', 'license_id': 'https://openalex.org/licenses/other-oa', 'version': 'submittedVersion', 'is_accepted': False, 'is_published': False}, 'sustainable_development_goals': [], 'grants': [], 'datasets': [], 'versions': [], 'referenced_works_count': 5, 'referenced_works': ['https://openalex.org/W1569549580', 'https://openalex.org/W2103581911', 'https://openalex.org/W2112482891', 'https://openalex.org/W2114067856', 'https://openalex.org/W2293225001'], 'related_works': ['https://openalex.org/W4251798485', 'https://openalex.org/W4247312607', 'https://openalex.org/W3115899447', 'https://openalex.org/W2340721088', 'https://openalex.org/W2122418911', 'https://openalex.org/W2092462759', 'https://openalex.org/W2042766074', 'https://openalex.org/W2014071052', 'https://openalex.org/W1993227264', 'https://openalex.org/W1540273122'], 'abstract_inverted_index': {'In': [0, 75], 'the': [1, 11, 59, 64, 90, 131, 145, 148, 151, 162, 166, 184, 202, 205, 227, 240, 244], 'context': [2], 'of': [3, 14, 20, 28, 48, 66, 101, 133, 147, 195, 197, 222, 230, 243], 'mapping': [4], 'high-level': [5], 'algorithms': [6], 'to': [7, 81, 116, 161, 191], 'hardware,': [8, 43, 61], 'we': [9, 77, 209, 224], 'consider': [10], 'basic': [12], 'problem': [13], 'generating': [15], 'an': [16, 29, 49, 99, 102, 117], 'efficient': [17], 'hardware': [18, 112, 217], 'implementation': [19], 'a': [21, 34, 141, 216], 'single': [22], 'threaded': [23], 'program,': [24, 164], 'in': [25, 42, 58, 70, 140, 144, 178, 186, 220], 'particular,': [26, 76], 'that': [27, 45, 130, 208, 226], 'inner': [30, 51, 103], 'loop.': [31], 'We': [32, 62, 128], 'describe': [33], 'control-flow': [35], 'mechanism': [36, 136], 'which': [37], 'provides': [38], 'dynamic': [39, 134, 173], 'loop-pipelining': [40, 68, 135, 158], 'capability': [41], 'so': [44], 'multiple': [46], 'iterations': [47], 'arbitrary': [50], 'loop': [52, 84, 104, 152, 174, 182, 206, 232], 'can': [53], 'be': [54], 'made': [55], 'simultaneously': [56], 'active': [57], 'generated': [60], 'study': [63], 'impact': [65], 'this': [67, 79], 'scheme': [69], 'conjunction': [71, 179], 'with': [72, 180], 'source-level': [73], 'loop-unrolling.': [74], 'apply': [78], 'technique': [80], 'some': [82], 'common': [83], 'kernels:': [85], 'regular': [86], 'kernels': [87, 207], 'such': [88], 'as': [89, 96, 98], 'fast-fourier': [91], 'transform': [92], 'and': [93, 120, 125, 156], 'matrix': [94], 'multiplication,': [95], 'well': [97], 'example': [100], 'whose': [105], 'body': [106], 'has': [107], 'branching.': [108], 'The': [109], 'resulting': [110, 111, 245], 'descriptions': [113], 'are': [114], 'synthesized': [115], 'FPGA': [118], 'target,': [119], 'then': [121, 165], 'characterized': [122], 'for': [123, 201], 'performance': [124, 146, 167, 187], 'resource': [126], 'utilization.': [127], 'observe': [129, 225], 'use': [132, 229], 'alone': [137], 'typically': [138], 'results': [139], 'significant': [142], 'improvements': [143], 'hardware.': [149, 246], 'If': [150], 'is': [153, 159, 169, 176], 'statically': [154], 'unrolled': [155, 163], 'if': [157], 'applied': [160], 'improvement': [168, 185], 'still': [170], 'substantial.': [171], 'When': [172], 'pipelining': [175], 'used': [177], 'static': [181], 'unrolling,': [183], 'ranges': [188], 'from': [189], '6X': [190], '20X': [192], '(in': [193], 'terms': [194], 'number': [196], 'clock': [198], 'cycles': [199], 'needed': [200], 'computation)': [203], 'across': [204], 'have': [210, 215], 'studied.': [211], 'These': [212], 'optimizations': [213, 233], 'do': [214], 'overhead,': [218], 'but,': [219], 'spite': [221], 'this,': [223], 'joint': [228], 'these': [231], 'not': [234], 'only': [235], 'improves': [236], 'performance,': [237], 'but': [238], 'also': [239], 'performance/cost': [241], 'ratio': [242]}, 'cited_by_api_url': 'https://api.openalex.org/works?filter=cites:W30800889', 'counts_by_year': [], 'updated_date': '2024-09-19T14:19:59.388980', 'created_date': '2016-06-24'}
Publication Information

Basic Information

Access and Citation

AI Researcher Chatbot

Primary Location

Authors

Topics

Keywords

Related Works