When cache blocking of sparse matrix vector multiply works and why

Rajesh Nishtala; Richard Fujimoto; James Demmel; Katherine Yelick
{'id': 'https://openalex.org/W2162630236', 'doi': 'https://doi.org/10.1007/s00200-007-0038-9', 'title': 'When cache blocking of sparse matrix vector multiply works and why', 'display_name': 'When cache blocking of sparse matrix vector multiply works and why', 'publication_year': 2007, 'publication_date': '2007-03-05', 'ids': {'openalex': 'https://openalex.org/W2162630236', 'doi': 'https://doi.org/10.1007/s00200-007-0038-9', 'mag': '2162630236'}, 'language': 'en', 'primary_location': {'is_oa': False, 'landing_page_url': 'https://doi.org/10.1007/s00200-007-0038-9', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S44535979', 'display_name': 'Applicable Algebra in Engineering Communication and Computing', 'issn_l': '0938-1279', 'issn': ['0938-1279', '1432-0622'], 'is_oa': False, 'is_in_doaj': False, 'is_core': True, 'host_organization': 'https://openalex.org/P4310319900', 'host_organization_name': 'Springer Science+Business Media', 'host_organization_lineage': ['https://openalex.org/P4310319900', 'https://openalex.org/P4310319965'], 'host_organization_lineage_names': ['Springer Science+Business Media', 'Springer Nature'], 'type': 'journal'}, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}, 'type': 'article', 'type_crossref': 'journal-article', 'indexed_in': ['crossref'], 'open_access': {'is_oa': True, 'oa_status': 'green', 'oa_url': 'http://bebop.cs.berkeley.edu/pubs/nishtala2007-cb-spmv.pdf', 'any_repository_has_fulltext': True}, 'authorships': [{'author_position': 'first', 'author': {'id': 'https://openalex.org/A5054130257', 'display_name': 'Rajesh Nishtala', 'orcid': None}, 'institutions': [{'id': 'https://openalex.org/I95457486', 'display_name': 'University of California, Berkeley', 'ror': 'https://ror.org/01an7q238', 'country_code': 'US', 'type': 'education', 'lineage': ['https://openalex.org/I95457486']}], 'countries': ['US'], 'is_corresponding': True, 'raw_author_name': 'Rajesh Nishtala', 'raw_affiliation_strings': ['Computer Science Division, University of California at Berkeley, 575 Soda Hall, Berkeley, CA, 94720, USA'], 'affiliations': [{'raw_affiliation_string': 'Computer Science Division, University of California at Berkeley, 575 Soda Hall, Berkeley, CA, 94720, USA', 'institution_ids': ['https://openalex.org/I95457486']}]}, {'author_position': 'middle', 'author': {'id': 'https://openalex.org/A5016738770', 'display_name': 'Richard Fujimoto', 'orcid': 'https://orcid.org/0000-0003-2178-138X'}, 'institutions': [{'id': 'https://openalex.org/I95457486', 'display_name': 'University of California, Berkeley', 'ror': 'https://ror.org/01an7q238', 'country_code': 'US', 'type': 'education', 'lineage': ['https://openalex.org/I95457486']}], 'countries': ['US'], 'is_corresponding': False, 'raw_author_name': 'Richard W. Vuduc', 'raw_affiliation_strings': ['Computer Science Division, University of California at Berkeley, 575 Soda Hall, Berkeley, CA, 94720, USA'], 'affiliations': [{'raw_affiliation_string': 'Computer Science Division, University of California at Berkeley, 575 Soda Hall, Berkeley, CA, 94720, USA', 'institution_ids': ['https://openalex.org/I95457486']}]}, {'author_position': 'middle', 'author': {'id': 'https://openalex.org/A5076825233', 'display_name': 'James Demmel', 'orcid': 'https://orcid.org/0000-0003-1145-3745'}, 'institutions': [{'id': 'https://openalex.org/I95457486', 'display_name': 'University of California, Berkeley', 'ror': 'https://ror.org/01an7q238', 'country_code': 'US', 'type': 'education', 'lineage': ['https://openalex.org/I95457486']}], 'countries': ['US'], 'is_corresponding': False, 'raw_author_name': 'James W. Demmel', 'raw_affiliation_strings': ['Computer Science Division, University of California at Berkeley, 575 Soda Hall, Berkeley, CA, 94720, USA'], 'affiliations': [{'raw_affiliation_string': 'Computer Science Division, University of California at Berkeley, 575 Soda Hall, Berkeley, CA, 94720, USA', 'institution_ids': ['https://openalex.org/I95457486']}]}, {'author_position': 'last', 'author': {'id': 'https://openalex.org/A5091741596', 'display_name': 'Katherine Yelick', 'orcid': 'https://orcid.org/0000-0003-0957-701X'}, 'institutions': [{'id': 'https://openalex.org/I95457486', 'display_name': 'University of California, Berkeley', 'ror': 'https://ror.org/01an7q238', 'country_code': 'US', 'type': 'education', 'lineage': ['https://openalex.org/I95457486']}], 'countries': ['US'], 'is_corresponding': False, 'raw_author_name': 'Katherine A. Yelick', 'raw_affiliation_strings': ['Computer Science Division, University of California at Berkeley, 575 Soda Hall, Berkeley, CA, 94720, USA'], 'affiliations': [{'raw_affiliation_string': 'Computer Science Division, University of California at Berkeley, 575 Soda Hall, Berkeley, CA, 94720, USA', 'institution_ids': ['https://openalex.org/I95457486']}]}], 'institution_assertions': [], 'countries_distinct_count': 1, 'institutions_distinct_count': 1, 'corresponding_author_ids': ['https://openalex.org/A5054130257'], 'corresponding_institution_ids': ['https://openalex.org/I95457486'], 'apc_list': {'value': 2290, 'currency': 'EUR', 'value_usd': 2890, 'provenance': 'doaj'}, 'apc_paid': None, 'fwci': 8.267, 'has_fulltext': True, 'fulltext_origin': 'ngrams', 'cited_by_count': 96, 'citation_normalized_percentile': {'value': 0.989218, 'is_in_top_1_percent': False, 'is_in_top_10_percent': True}, 'cited_by_percentile_year': {'min': 96, 'max': 97}, 'biblio': {'volume': '18', 'issue': '3', 'first_page': '297', 'last_page': '311'}, 'is_retracted': False, 'is_paratext': False, 'primary_topic': {'id': 'https://openalex.org/T10054', 'display_name': 'Parallel Computing and Performance Optimization', 'score': 0.9999, 'subfield': {'id': 'https://openalex.org/subfields/1708', 'display_name': 'Hardware and Architecture'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, 'topics': [{'id': 'https://openalex.org/T10054', 'display_name': 'Parallel Computing and Performance Optimization', 'score': 0.9999, 'subfield': {'id': 'https://openalex.org/subfields/1708', 'display_name': 'Hardware and Architecture'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T11181', 'display_name': 'Distributed Storage Systems and Network Coding', 'score': 0.9998, 'subfield': {'id': 'https://openalex.org/subfields/1705', 'display_name': 'Computer Networks and Communications'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10829', 'display_name': 'Networks on Chip in System-on-Chip Design', 'score': 0.9989, 'subfield': {'id': 'https://openalex.org/subfields/1705', 'display_name': 'Computer Networks and Communications'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}], 'keywords': [{'id': 'https://openalex.org/keywords/blocking', 'display_name': 'Blocking (statistics)', 'score': 0.8279731}, {'id': 'https://openalex.org/keywords/cache-oblivious-algorithm', 'display_name': 'Cache-oblivious algorithm', 'score': 0.5760702}, {'id': 'https://openalex.org/keywords/gpu-computing', 'display_name': 'GPU Computing', 'score': 0.519147}, {'id': 'https://openalex.org/keywords/performance-optimization', 'display_name': 'Performance Optimization', 'score': 0.511455}, {'id': 'https://openalex.org/keywords/cache-pollution', 'display_name': 'Cache pollution', 'score': 0.4742538}, {'id': 'https://openalex.org/keywords/matrix', 'display_name': 'Matrix (chemical analysis)', 'score': 0.47355902}, {'id': 'https://openalex.org/keywords/cache-invalidation', 'display_name': 'Cache invalidation', 'score': 0.45130855}], 'concepts': [{'id': 'https://openalex.org/C115537543', 'wikidata': 'https://www.wikidata.org/wiki/Q165596', 'display_name': 'Cache', 'level': 2, 'score': 0.8559662}, {'id': 'https://openalex.org/C144745244', 'wikidata': 'https://www.wikidata.org/wiki/Q4927286', 'display_name': 'Blocking (statistics)', 'level': 2, 'score': 0.8279731}, {'id': 'https://openalex.org/C173608175', 'wikidata': 'https://www.wikidata.org/wiki/Q232661', 'display_name': 'Parallel computing', 'level': 1, 'score': 0.75028443}, {'id': 'https://openalex.org/C41008148', 'wikidata': 'https://www.wikidata.org/wiki/Q21198', 'display_name': 'Computer science', 'level': 0, 'score': 0.74480736}, {'id': 'https://openalex.org/C38556500', 'wikidata': 'https://www.wikidata.org/wiki/Q13404475', 'display_name': 'Cache algorithms', 'level': 4, 'score': 0.6098269}, {'id': 'https://openalex.org/C2777210771', 'wikidata': 'https://www.wikidata.org/wiki/Q4927124', 'display_name': 'Block (permutation group theory)', 'level': 2, 'score': 0.5796714}, {'id': 'https://openalex.org/C59687516', 'wikidata': 'https://www.wikidata.org/wiki/Q5015938', 'display_name': 'Cache-oblivious algorithm', 'level': 5, 'score': 0.5760702}, {'id': 'https://openalex.org/C189783530', 'wikidata': 'https://www.wikidata.org/wiki/Q352090', 'display_name': 'CPU cache', 'level': 3, 'score': 0.5155184}, {'id': 'https://openalex.org/C201148951', 'wikidata': 'https://www.wikidata.org/wiki/Q5015976', 'display_name': 'Cache coloring', 'level': 4, 'score': 0.5101393}, {'id': 'https://openalex.org/C113166858', 'wikidata': 'https://www.wikidata.org/wiki/Q5015981', 'display_name': 'Cache pollution', 'level': 5, 'score': 0.4742538}, {'id': 'https://openalex.org/C106487976', 'wikidata': 'https://www.wikidata.org/wiki/Q685816', 'display_name': 'Matrix (chemical analysis)', 'level': 2, 'score': 0.47355902}, {'id': 'https://openalex.org/C25536678', 'wikidata': 'https://www.wikidata.org/wiki/Q5015977', 'display_name': 'Cache invalidation', 'level': 5, 'score': 0.45130855}, {'id': 'https://openalex.org/C11413529', 'wikidata': 'https://www.wikidata.org/wiki/Q8366', 'display_name': 'Algorithm', 'level': 1, 'score': 0.40520462}, {'id': 'https://openalex.org/C80444323', 'wikidata': 'https://www.wikidata.org/wiki/Q2878974', 'display_name': 'Theoretical computer science', 'level': 1, 'score': 0.34785724}, {'id': 'https://openalex.org/C33923547', 'wikidata': 'https://www.wikidata.org/wiki/Q395', 'display_name': 'Mathematics', 'level': 0, 'score': 0.14836878}, {'id': 'https://openalex.org/C114614502', 'wikidata': 'https://www.wikidata.org/wiki/Q76592', 'display_name': 'Combinatorics', 'level': 1, 'score': 0.057519257}, {'id': 'https://openalex.org/C31258907', 'wikidata': 'https://www.wikidata.org/wiki/Q1301371', 'display_name': 'Computer network', 'level': 1, 'score': 0.056976914}, {'id': 'https://openalex.org/C192562407', 'wikidata': 'https://www.wikidata.org/wiki/Q228736', 'display_name': 'Materials science', 'level': 0, 'score': 0.052309006}, {'id': 'https://openalex.org/C159985019', 'wikidata': 'https://www.wikidata.org/wiki/Q181790', 'display_name': 'Composite material', 'level': 1, 'score': 0.0}], 'mesh': [], 'locations_count': 2, 'locations': [{'is_oa': False, 'landing_page_url': 'https://doi.org/10.1007/s00200-007-0038-9', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S44535979', 'display_name': 'Applicable Algebra in Engineering Communication and Computing', 'issn_l': '0938-1279', 'issn': ['0938-1279', '1432-0622'], 'is_oa': False, 'is_in_doaj': False, 'is_core': True, 'host_organization': 'https://openalex.org/P4310319900', 'host_organization_name': 'Springer Science+Business Media', 'host_organization_lineage': ['https://openalex.org/P4310319900', 'https://openalex.org/P4310319965'], 'host_organization_lineage_names': ['Springer Science+Business Media', 'Springer Nature'], 'type': 'journal'}, 'license': None, 'license_id': None, 'version': None, 'is_accepted': False, 'is_published': False}, {'is_oa': True, 'landing_page_url': 'http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.68.9476', 'pdf_url': 'http://bebop.cs.berkeley.edu/pubs/nishtala2007-cb-spmv.pdf', 'source': {'id': 'https://openalex.org/S4306400349', 'display_name': 'CiteSeer X (The Pennsylvania State University)', 'issn_l': None, 'issn': None, 'is_oa': True, 'is_in_doaj': False, 'is_core': False, 'host_organization': 'https://openalex.org/I130769515', 'host_organization_name': 'Pennsylvania State University', 'host_organization_lineage': ['https://openalex.org/I130769515'], 'host_organization_lineage_names': ['Pennsylvania State University'], 'type': 'repository'}, 'license': None, 'license_id': None, 'version': 'submittedVersion', 'is_accepted': False, 'is_published': False}], 'best_oa_location': {'is_oa': True, 'landing_page_url': 'http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.68.9476', 'pdf_url': 'http://bebop.cs.berkeley.edu/pubs/nishtala2007-cb-spmv.pdf', 'source': {'id': 'https://openalex.org/S4306400349', 'display_name': 'CiteSeer X (The Pennsylvania State University)', 'issn_l': None, 'issn': None, 'is_oa': True, 'is_in_doaj': False, 'is_core': False, 'host_organization': 'https://openalex.org/I130769515', 'host_organization_name': 'Pennsylvania State University', 'host_organization_lineage': ['https://openalex.org/I130769515'], 'host_organization_lineage_names': ['Pennsylvania State University'], 'type': 'repository'}, 'license': None, 'license_id': None, 'version': 'submittedVersion', 'is_accepted': False, 'is_published': False}, 'sustainable_development_goals': [], 'grants': [], 'datasets': [], 'versions': [], 'referenced_works_count': 20, 'referenced_works': ['https://openalex.org/W1488793182', 'https://openalex.org/W1583189038', 'https://openalex.org/W1596846800', 'https://openalex.org/W1651687773', 'https://openalex.org/W1653630692', 'https://openalex.org/W1999007222', 'https://openalex.org/W2047044255', 'https://openalex.org/W2060357239', 'https://openalex.org/W2082831001', 'https://openalex.org/W2104120668', 'https://openalex.org/W2111711073', 'https://openalex.org/W2125955291', 'https://openalex.org/W2135653967', 'https://openalex.org/W2164139896', 'https://openalex.org/W2167868137', 'https://openalex.org/W3018151124', 'https://openalex.org/W3136479147', 'https://openalex.org/W4254879828', 'https://openalex.org/W4256588782', 'https://openalex.org/W4285719527'], 'related_works': ['https://openalex.org/W4252570104', 'https://openalex.org/W2734782074', 'https://openalex.org/W2546991807', 'https://openalex.org/W2538519144', 'https://openalex.org/W2121191383', 'https://openalex.org/W2109265242', 'https://openalex.org/W2098406302', 'https://openalex.org/W2076114130', 'https://openalex.org/W1584415117', 'https://openalex.org/W1505654810'], 'abstract_inverted_index': {'We': [0, 22, 63], 'present': [1], 'new': [2, 41], 'performance': [3], 'models': [4, 26, 42], 'and': [5, 37], 'more': [6], 'compact': [7], 'data': [8], 'structures': [9], 'for': [10], 'cache': [11, 36, 59], 'blocking': [12, 60], 'when': [13, 58], 'applied': [14], 'to': [15, 46], 'sparse': [16], 'matrix-vector': [17], 'multiply': [18], '(SpM': [19], '×': [20, 75], 'V).': [21], 'extend': [23], 'our': [24], 'prior': [25], 'by': [27], 'relaxing': [28], 'the': [29, 32, 40], 'assumption': [30], 'that': [31, 39, 56, 68], 'vectors': [33], 'fit': [34], 'in': [35], 'find': [38], 'are': [43], 'accurate': [44], 'enough': [45], 'predict': [47, 57], 'optimum': [48], 'block': [49], 'sizes.': [50], 'In': [51], 'addition,': [52], 'we': [53], 'determine': [54], 'criteria': [55], 'improves': [61], 'performance.': [62], 'conclude': [64], 'with': [65], 'architectural': [66], 'suggestions': [67], 'would': [69], 'make': [70], 'memory': [71], 'systems': [72], 'execute': [73], 'SpM': [74], 'V': [76], 'faster.': [77]}, 'cited_by_api_url': 'https://api.openalex.org/works?filter=cites:W2162630236', 'counts_by_year': [{'year': 2023, 'cited_by_count': 2}, {'year': 2022, 'cited_by_count': 2}, {'year': 2021, 'cited_by_count': 4}, {'year': 2020, 'cited_by_count': 6}, {'year': 2019, 'cited_by_count': 5}, {'year': 2018, 'cited_by_count': 8}, {'year': 2017, 'cited_by_count': 5}, {'year': 2016, 'cited_by_count': 5}, {'year': 2015, 'cited_by_count': 5}, {'year': 2014, 'cited_by_count': 7}, {'year': 2013, 'cited_by_count': 7}, {'year': 2012, 'cited_by_count': 3}], 'updated_date': '2024-09-19T14:32:18.634190', 'created_date': '2016-06-24'}
Publication Information

Basic Information

Access and Citation

AI Researcher Chatbot

Primary Location

Authors

Topics

Keywords

Related Works