Enhanced Parallel Shared-Memory Sparse Matrix– Vector Multiplication using Optimized CSB

K V Vijay Girish; G. Kharmega Sundararaj
{'id': 'https://openalex.org/W2149529325', 'doi': None, 'title': 'Enhanced Parallel Shared-Memory Sparse Matrix– Vector Multiplication using Optimized CSB', 'display_name': 'Enhanced Parallel Shared-Memory Sparse Matrix– Vector Multiplication using Optimized CSB', 'publication_year': 2013, 'publication_date': '2013-01-01', 'ids': {'openalex': 'https://openalex.org/W2149529325', 'mag': '2149529325'}, 'language': 'en', 'primary_location': {'is_oa': False, 'landing_page_url': 'https://www.ciitresearch.org/dl/index.php/aiml/article/view/AIML032013003', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S2764910239', 'display_name': 'CiiT international journal of artificial intelligent systems and machine learning', 'issn_l': '0974-9667', 'issn': ['0974-9667'], 'is_oa': False, 'is_in_doaj': False, 'is_core': False, 'host_organization': None, 'host_organization_name': None, 'host_organization_lineage': [], 'host_organization_lineage_names': [], 'type': 'journal'}, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}, 'type': 'article', 'type_crossref': 'journal-article', 'indexed_in': [], 'open_access': {'is_oa': False, 'oa_status': 'closed', 'oa_url': None, 'any_repository_has_fulltext': False}, 'authorships': [{'author_position': 'first', 'author': {'id': 'https://openalex.org/A5103008705', 'display_name': 'K V Vijay Girish', 'orcid': 'https://orcid.org/0000-0002-3332-1500'}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'Krishna Girish', 'raw_affiliation_strings': [], 'affiliations': []}, {'author_position': 'last', 'author': {'id': 'https://openalex.org/A5032279993', 'display_name': 'G. Kharmega Sundararaj', 'orcid': None}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'G. Kharmega Sundararaj', 'raw_affiliation_strings': [], 'affiliations': []}], 'countries_distinct_count': 0, 'institutions_distinct_count': 0, 'corresponding_author_ids': [], 'corresponding_institution_ids': [], 'apc_list': None, 'apc_paid': None, 'fwci': 0.0, 'has_fulltext': False, 'cited_by_count': 0, 'citation_normalized_percentile': {'value': 0.0, 'is_in_top_1_percent': False, 'is_in_top_10_percent': False}, 'cited_by_percentile_year': {'min': 0, 'max': 65}, 'biblio': {'volume': '5', 'issue': '3', 'first_page': '110', 'last_page': '115'}, 'is_retracted': False, 'is_paratext': False, 'primary_topic': {'id': 'https://openalex.org/T10054', 'display_name': 'Parallel Computing and Performance Optimization', 'score': 0.9996, 'subfield': {'id': 'https://openalex.org/subfields/1708', 'display_name': 'Hardware and Architecture'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, 'topics': [{'id': 'https://openalex.org/T10054', 'display_name': 'Parallel Computing and Performance Optimization', 'score': 0.9996, 'subfield': {'id': 'https://openalex.org/subfields/1708', 'display_name': 'Hardware and Architecture'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10715', 'display_name': 'Distributed Grid Computing Systems', 'score': 0.9989, 'subfield': {'id': 'https://openalex.org/subfields/1705', 'display_name': 'Computer Networks and Communications'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T11181', 'display_name': 'Distributed Storage Systems and Network Coding', 'score': 0.9987, 'subfield': {'id': 'https://openalex.org/subfields/1705', 'display_name': 'Computer Networks and Communications'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}], 'keywords': [{'id': 'https://openalex.org/keywords/parallel-computing', 'display_name': 'Parallel Computing', 'score': 0.582984}, {'id': 'https://openalex.org/keywords/memory-bandwidth', 'display_name': 'Memory bandwidth', 'score': 0.5810292}, {'id': 'https://openalex.org/keywords/performance-optimization', 'display_name': 'Performance Optimization', 'score': 0.519466}, {'id': 'https://openalex.org/keywords/distributed-storage', 'display_name': 'Distributed Storage', 'score': 0.515171}, {'id': 'https://openalex.org/keywords/high-performance-computing', 'display_name': 'High-Performance Computing', 'score': 0.503076}, {'id': 'https://openalex.org/keywords/heterogeneous-computing', 'display_name': 'Heterogeneous Computing', 'score': 0.500824}, {'id': 'https://openalex.org/keywords/matrix', 'display_name': 'Matrix (chemical analysis)', 'score': 0.48769936}, {'id': 'https://openalex.org/keywords/kernel', 'display_name': 'Kernel (algebra)', 'score': 0.47521526}], 'concepts': [{'id': 'https://openalex.org/C41008148', 'wikidata': 'https://www.wikidata.org/wiki/Q21198', 'display_name': 'Computer science', 'level': 0, 'score': 0.8303313}, {'id': 'https://openalex.org/C173608175', 'wikidata': 'https://www.wikidata.org/wiki/Q232661', 'display_name': 'Parallel computing', 'level': 1, 'score': 0.80132616}, {'id': 'https://openalex.org/C56372850', 'wikidata': 'https://www.wikidata.org/wiki/Q1050404', 'display_name': 'Sparse matrix', 'level': 3, 'score': 0.75078744}, {'id': 'https://openalex.org/C17349429', 'wikidata': 'https://www.wikidata.org/wiki/Q1049914', 'display_name': 'Matrix multiplication', 'level': 3, 'score': 0.6521622}, {'id': 'https://openalex.org/C2780595030', 'wikidata': 'https://www.wikidata.org/wiki/Q3860309', 'display_name': 'Multiplication (music)', 'level': 2, 'score': 0.6435437}, {'id': 'https://openalex.org/C188045654', 'wikidata': 'https://www.wikidata.org/wiki/Q17148339', 'display_name': 'Memory bandwidth', 'level': 2, 'score': 0.5810292}, {'id': 'https://openalex.org/C45374587', 'wikidata': 'https://www.wikidata.org/wiki/Q12525525', 'display_name': 'Computation', 'level': 2, 'score': 0.5608834}, {'id': 'https://openalex.org/C43364308', 'wikidata': 'https://www.wikidata.org/wiki/Q8799', 'display_name': 'Byte', 'level': 2, 'score': 0.5097782}, {'id': 'https://openalex.org/C157764524', 'wikidata': 'https://www.wikidata.org/wiki/Q1383412', 'display_name': 'Throughput', 'level': 3, 'score': 0.49878836}, {'id': 'https://openalex.org/C106487976', 'wikidata': 'https://www.wikidata.org/wiki/Q685816', 'display_name': 'Matrix (chemical analysis)', 'level': 2, 'score': 0.48769936}, {'id': 'https://openalex.org/C74193536', 'wikidata': 'https://www.wikidata.org/wiki/Q574844', 'display_name': 'Kernel (algebra)', 'level': 2, 'score': 0.47521526}, {'id': 'https://openalex.org/C11413529', 'wikidata': 'https://www.wikidata.org/wiki/Q8366', 'display_name': 'Algorithm', 'level': 1, 'score': 0.4318645}, {'id': 'https://openalex.org/C83283714', 'wikidata': 'https://www.wikidata.org/wiki/Q121117', 'display_name': 'Supercomputer', 'level': 2, 'score': 0.4306603}, {'id': 'https://openalex.org/C9390403', 'wikidata': 'https://www.wikidata.org/wiki/Q3966', 'display_name': 'Computer hardware', 'level': 1, 'score': 0.22729677}, {'id': 'https://openalex.org/C33923547', 'wikidata': 'https://www.wikidata.org/wiki/Q395', 'display_name': 'Mathematics', 'level': 0, 'score': 0.0963923}, {'id': 'https://openalex.org/C76155785', 'wikidata': 'https://www.wikidata.org/wiki/Q418', 'display_name': 'Telecommunications', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C121332964', 'wikidata': 'https://www.wikidata.org/wiki/Q413', 'display_name': 'Physics', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C192562407', 'wikidata': 'https://www.wikidata.org/wiki/Q228736', 'display_name': 'Materials science', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C62520636', 'wikidata': 'https://www.wikidata.org/wiki/Q944', 'display_name': 'Quantum mechanics', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C114614502', 'wikidata': 'https://www.wikidata.org/wiki/Q76592', 'display_name': 'Combinatorics', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C159985019', 'wikidata': 'https://www.wikidata.org/wiki/Q181790', 'display_name': 'Composite material', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C555944384', 'wikidata': 'https://www.wikidata.org/wiki/Q249', 'display_name': 'Wireless', 'level': 2, 'score': 0.0}, {'id': 'https://openalex.org/C84114770', 'wikidata': 'https://www.wikidata.org/wiki/Q46344', 'display_name': 'Quantum', 'level': 2, 'score': 0.0}, {'id': 'https://openalex.org/C163716315', 'wikidata': 'https://www.wikidata.org/wiki/Q901177', 'display_name': 'Gaussian', 'level': 2, 'score': 0.0}], 'mesh': [], 'locations_count': 1, 'locations': [{'is_oa': False, 'landing_page_url': 'https://www.ciitresearch.org/dl/index.php/aiml/article/view/AIML032013003', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S2764910239', 'display_name': 'CiiT international journal of artificial intelligent systems and machine learning', 'issn_l': '0974-9667', 'issn': ['0974-9667'], 'is_oa': False, 'is_in_doaj': False, 'is_core': False, 'host_organization': None, 'host_organization_name': None, 'host_organization_lineage': [], 'host_organization_lineage_names': [], 'type': 'journal'}, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}], 'best_oa_location': None, 'sustainable_development_goals': [], 'grants': [], 'datasets': [], 'versions': [], 'referenced_works_count': 0, 'referenced_works': [], 'related_works': ['https://openalex.org/W3158543914', 'https://openalex.org/W3137131725', 'https://openalex.org/W3103168911', 'https://openalex.org/W3022522263', 'https://openalex.org/W2952034948', 'https://openalex.org/W2898875679', 'https://openalex.org/W2791075542', 'https://openalex.org/W2544965371', 'https://openalex.org/W2271268108', 'https://openalex.org/W2186641113', 'https://openalex.org/W2165504907', 'https://openalex.org/W2163449859', 'https://openalex.org/W2145194992', 'https://openalex.org/W2140269398', 'https://openalex.org/W2126004407', 'https://openalex.org/W2091843288', 'https://openalex.org/W2080353445', 'https://openalex.org/W2039875226', 'https://openalex.org/W2006213703', 'https://openalex.org/W1947430491'], 'abstract_inverted_index': {'Sparse': [0], 'matrix-vector': [1], 'multiplication': [2], '(SpMxV)': [3], 'has': [4], 'been\xa0considered': [5], 'as': [6, 169], 'one': [7, 157], 'of': [8, 19, 41, 110, 194], 'the': [9, 20, 108, 159, 170, 176, 192, 199], 'most': [10], 'significant': [11], 'computational': [12, 151], 'scientific\xa0kernels': [13], 'approaches.': [14], 'The': [15, 114, 140], 'key': [16], 'algorithmic': [17], 'approach': [18, 119, 145], 'SpMxV\xa0kernel,': [21], 'that': [22, 47, 146, 191], 'inhibits': [23], 'it': [24], 'from': [25], 'achieving': [26], 'high': [27, 128, 148], 'performance,': [28], 'is': [29, 90, 101, 143], 'its': [30], 'very\xa0low': [31], 'flop:': [32], 'byte': [33], 'ratio': [34], 'with': [35, 95, 182], 'speeded': [36], 'performance.': [37], 'Accessing': [38], 'the\xa0tremendous': [39], 'potential': [40], 'throughput-oriented': [42], 'processors': [43, 183], 'for': [44, 69, 120, 162, 173], 'sparse\xa0operations': [45], 'requires': [46], 'we': [48], 'should': [49], 'allow': [50, 147], 'substantial': [51], 'fine-grained\xa0parallelism': [52], 'and': [53, 81, 99, 134, 164], 'impose': [54], 'sufficient': [55], 'regularity': [56], 'on': [57, 131, 156], 'execution': [58], 'paths': [59], 'and\xa0memory': [60], 'access': [61], 'patterns.': [62], 'In': [63], 'this': [64], 'paper,': [65], 'a': [66, 102], 'storage': [67], 'format': [68, 142], 'sparse': [70, 75, 93, 123], 'matrices,': [71], 'called': [72], 'optimized': [73], 'compressed': [74], 'blocks': [76], '(CSB),': [77], 'which\xa0allows': [78], 'both': [79], 'Ax': [80, 163], 'ATx': [82, 165], 'to': [83, 106], 'be': [84], 'computed': [85], 'efficiently': [86], 'in': [87, 112], 'parallel,': [88], 'where\xa0A': [89], 'an': [91], 'n×n': [92], 'matrix': [94, 124, 204], 'nnz≥n': [96], 'non': [97], 'zeros': [98], 'x': [100], 'dense': [103], 'nvector\xa0is': [104], 'used': [105], 'enhance': [107], 'speed': [109], 'computation': [111], 'parallelization': [113], 'proposed': [115], 'system': [116], 'provides': [117, 127], 'optimizational': [118, 144], 'enhanced\xa0Computations.': [121], 'Our': [122], 'multiple-vector': [125], 'multiplication\xa0algorithm': [126], 'throughput': [129], 'results': [130, 154], 'all': [132], 'platforms': [133], 'is\xa0implemented': [135], 'using': [136], 'platform': [137], 'neutral': [138], 'optimizations.': [139], 'proposed\xa0Storage': [141], 'rate': [149], 'access\xa0additional': [150], 'capabilities.': [152], 'Experimental': [153], 'indicate\xa0that': [155], 'processor,': [158], 'CSB': [160, 177, 196], 'algorithms': [161, 178], 'run': [166], 'just': [167], 'as\xa0fast': [168], 'CSR': [171], 'algorithm': [172], 'Ax,': [174], 'but': [175, 202], 'also': [179], 'scale\xa0up': [180], 'linearly': [181], 'until': [184], 'limited': [185], 'by': [186], 'off-chip': [187], 'memory\xa0bandwidth.': [188], 'We': [189], 'show': [190], 'use': [193], 'enhanced': [195], 'not': [197], 'only\xa0improves': [198], 'performance': [200], 'significantly': [201], 'reduces': [203], 'storage\xa0also.': [205]}, 'cited_by_api_url': 'https://api.openalex.org/works?filter=cites:W2149529325', 'counts_by_year': [], 'updated_date': '2024-08-21T07:24:06.627397', 'created_date': '2016-06-24'}
Publication Information

Basic Information

Access and Citation

AI Researcher Chatbot

Primary Location

Authors

Topics

Keywords

Related Works