Nonparametric Feature Impact and Importance

Name: Work Video:
Duration: 3 min 30 s
Terence Parr; James Wilson; Jeff Hamrick
{'id': 'https://openalex.org/W4386564352', 'doi': 'https://doi.org/10.48550/arxiv.2006.04750', 'title': 'Nonparametric Feature Impact and Importance', 'display_name': 'Nonparametric Feature Impact and Importance', 'publication_year': 2020, 'publication_date': '2020-01-01', 'ids': {'openalex': 'https://openalex.org/W4386564352', 'doi': 'https://doi.org/10.48550/arxiv.2006.04750'}, 'language': 'en', 'primary_location': {'is_oa': True, 'landing_page_url': 'https://arxiv.org/abs/2006.04750', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S4306400194', 'display_name': 'arXiv (Cornell University)', 'issn_l': None, 'issn': None, 'is_oa': True, 'is_in_doaj': False, 'is_core': False, 'host_organization': 'https://openalex.org/I205783295', 'host_organization_name': 'Cornell University', 'host_organization_lineage': ['https://openalex.org/I205783295'], 'host_organization_lineage_names': ['Cornell University'], 'type': 'repository'}, 'license': 'other-oa', 'license_id': 'https://openalex.org/licenses/other-oa', 'version': 'submittedVersion', 'is_accepted': False, 'is_published': False}, 'type': 'preprint', 'type_crossref': 'posted-content', 'indexed_in': ['arxiv', 'datacite'], 'open_access': {'is_oa': True, 'oa_status': 'green', 'oa_url': 'https://arxiv.org/abs/2006.04750', 'any_repository_has_fulltext': True}, 'authorships': [{'author_position': 'first', 'author': {'id': 'https://openalex.org/A5020066825', 'display_name': 'Terence Parr', 'orcid': 'https://orcid.org/0000-0001-8296-7888'}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'Parr, Terence', 'raw_affiliation_strings': [], 'affiliations': []}, {'author_position': 'middle', 'author': {'id': 'https://openalex.org/A5016000044', 'display_name': 'James Wilson', 'orcid': 'https://orcid.org/0000-0002-2354-935X'}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'Wilson, James D.', 'raw_affiliation_strings': [], 'affiliations': []}, {'author_position': 'last', 'author': {'id': 'https://openalex.org/A5058924810', 'display_name': 'Jeff Hamrick', 'orcid': None}, 'institutions': [], 'countries': [], 'is_corresponding': False, 'raw_author_name': 'Hamrick, Jeff', 'raw_affiliation_strings': [], 'affiliations': []}], 'institution_assertions': [], 'countries_distinct_count': 0, 'institutions_distinct_count': 0, 'corresponding_author_ids': [], 'corresponding_institution_ids': [], 'apc_list': None, 'apc_paid': None, 'fwci': None, 'has_fulltext': False, 'cited_by_count': 5, 'citation_normalized_percentile': {'value': 0.91847, 'is_in_top_1_percent': False, 'is_in_top_10_percent': True}, 'cited_by_percentile_year': {'min': 79, 'max': 81}, 'biblio': {'volume': None, 'issue': None, 'first_page': None, 'last_page': None}, 'is_retracted': False, 'is_paratext': False, 'primary_topic': {'id': 'https://openalex.org/T13398', 'display_name': 'Data Analysis with R', 'score': 0.8259, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, 'topics': [{'id': 'https://openalex.org/T13398', 'display_name': 'Data Analysis with R', 'score': 0.8259, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T12535', 'display_name': 'Machine Learning and Data Classification', 'score': 0.8012, 'subfield': {'id': 'https://openalex.org/subfields/1702', 'display_name': 'Artificial Intelligence'}, 'field': {'id': 'https://openalex.org/fields/17', 'display_name': 'Computer Science'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}, {'id': 'https://openalex.org/T10136', 'display_name': 'Statistical Methods and Inference', 'score': 0.78, 'subfield': {'id': 'https://openalex.org/subfields/2613', 'display_name': 'Statistics and Probability'}, 'field': {'id': 'https://openalex.org/fields/26', 'display_name': 'Mathematics'}, 'domain': {'id': 'https://openalex.org/domains/3', 'display_name': 'Physical Sciences'}}], 'keywords': [{'id': 'https://openalex.org/keywords/feature', 'display_name': 'Feature (linguistics)', 'score': 0.82562995}, {'id': 'https://openalex.org/keywords/generality', 'display_name': 'Generality', 'score': 0.7326822}, {'id': 'https://openalex.org/keywords/conflation', 'display_name': 'Conflation', 'score': 0.50090456}, {'id': 'https://openalex.org/keywords/feature-model', 'display_name': 'Feature model', 'score': 0.42459676}], 'concepts': [{'id': 'https://openalex.org/C148483581', 'wikidata': 'https://www.wikidata.org/wiki/Q446488', 'display_name': 'Feature selection', 'level': 2, 'score': 0.8698859}, {'id': 'https://openalex.org/C2776401178', 'wikidata': 'https://www.wikidata.org/wiki/Q12050496', 'display_name': 'Feature (linguistics)', 'level': 2, 'score': 0.82562995}, {'id': 'https://openalex.org/C2780767217', 'wikidata': 'https://www.wikidata.org/wiki/Q5532421', 'display_name': 'Generality', 'level': 2, 'score': 0.7326822}, {'id': 'https://openalex.org/C102366305', 'wikidata': 'https://www.wikidata.org/wiki/Q1097688', 'display_name': 'Nonparametric statistics', 'level': 2, 'score': 0.6525818}, {'id': 'https://openalex.org/C182365436', 'wikidata': 'https://www.wikidata.org/wiki/Q50701', 'display_name': 'Variable (mathematics)', 'level': 2, 'score': 0.6061286}, {'id': 'https://openalex.org/C41008148', 'wikidata': 'https://www.wikidata.org/wiki/Q21198', 'display_name': 'Computer science', 'level': 0, 'score': 0.5903392}, {'id': 'https://openalex.org/C124101348', 'wikidata': 'https://www.wikidata.org/wiki/Q172491', 'display_name': 'Data mining', 'level': 1, 'score': 0.5269956}, {'id': 'https://openalex.org/C130440534', 'wikidata': 'https://www.wikidata.org/wiki/Q14946528', 'display_name': 'Conflation', 'level': 2, 'score': 0.50090456}, {'id': 'https://openalex.org/C154945302', 'wikidata': 'https://www.wikidata.org/wiki/Q11660', 'display_name': 'Artificial intelligence', 'level': 1, 'score': 0.4670464}, {'id': 'https://openalex.org/C119857082', 'wikidata': 'https://www.wikidata.org/wiki/Q2539', 'display_name': 'Machine learning', 'level': 1, 'score': 0.45692965}, {'id': 'https://openalex.org/C2779530757', 'wikidata': 'https://www.wikidata.org/wiki/Q1207505', 'display_name': 'Quality (philosophy)', 'level': 2, 'score': 0.43886176}, {'id': 'https://openalex.org/C101814296', 'wikidata': 'https://www.wikidata.org/wiki/Q5439685', 'display_name': 'Feature model', 'level': 3, 'score': 0.42459676}, {'id': 'https://openalex.org/C177264268', 'wikidata': 'https://www.wikidata.org/wiki/Q1514741', 'display_name': 'Set (abstract data type)', 'level': 2, 'score': 0.41623622}, {'id': 'https://openalex.org/C149782125', 'wikidata': 'https://www.wikidata.org/wiki/Q160039', 'display_name': 'Econometrics', 'level': 1, 'score': 0.29252028}, {'id': 'https://openalex.org/C33923547', 'wikidata': 'https://www.wikidata.org/wiki/Q395', 'display_name': 'Mathematics', 'level': 0, 'score': 0.223923}, {'id': 'https://openalex.org/C15744967', 'wikidata': 'https://www.wikidata.org/wiki/Q9418', 'display_name': 'Psychology', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C134306372', 'wikidata': 'https://www.wikidata.org/wiki/Q7754', 'display_name': 'Mathematical analysis', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C138885662', 'wikidata': 'https://www.wikidata.org/wiki/Q5891', 'display_name': 'Philosophy', 'level': 0, 'score': 0.0}, {'id': 'https://openalex.org/C41895202', 'wikidata': 'https://www.wikidata.org/wiki/Q8162', 'display_name': 'Linguistics', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C111472728', 'wikidata': 'https://www.wikidata.org/wiki/Q9471', 'display_name': 'Epistemology', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C2777904410', 'wikidata': 'https://www.wikidata.org/wiki/Q7397', 'display_name': 'Software', 'level': 2, 'score': 0.0}, {'id': 'https://openalex.org/C542102704', 'wikidata': 'https://www.wikidata.org/wiki/Q183257', 'display_name': 'Psychotherapist', 'level': 1, 'score': 0.0}, {'id': 'https://openalex.org/C199360897', 'wikidata': 'https://www.wikidata.org/wiki/Q9143', 'display_name': 'Programming language', 'level': 1, 'score': 0.0}], 'mesh': [], 'locations_count': 3, 'locations': [{'is_oa': True, 'landing_page_url': 'https://arxiv.org/abs/2006.04750', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S4306400194', 'display_name': 'arXiv (Cornell University)', 'issn_l': None, 'issn': None, 'is_oa': True, 'is_in_doaj': False, 'is_core': False, 'host_organization': 'https://openalex.org/I205783295', 'host_organization_name': 'Cornell University', 'host_organization_lineage': ['https://openalex.org/I205783295'], 'host_organization_lineage_names': ['Cornell University'], 'type': 'repository'}, 'license': 'other-oa', 'license_id': 'https://openalex.org/licenses/other-oa', 'version': 'submittedVersion', 'is_accepted': False, 'is_published': False}, {'is_oa': True, 'landing_page_url': 'http://arxiv.org/abs/2006.04750', 'pdf_url': 'http://arxiv.org/pdf/2006.04750', 'source': {'id': 'https://openalex.org/S4306400194', 'display_name': 'arXiv (Cornell University)', 'issn_l': None, 'issn': None, 'is_oa': True, 'is_in_doaj': False, 'is_core': False, 'host_organization': 'https://openalex.org/I205783295', 'host_organization_name': 'Cornell University', 'host_organization_lineage': ['https://openalex.org/I205783295'], 'host_organization_lineage_names': ['Cornell University'], 'type': 'repository'}, 'license': None, 'license_id': None, 'version': 'submittedVersion', 'is_accepted': False, 'is_published': False}, {'is_oa': False, 'landing_page_url': 'https://api.datacite.org/dois/10.48550/arxiv.2006.04750', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S4393179698', 'display_name': 'DataCite API', 'issn_l': None, 'issn': None, 'is_oa': True, 'is_in_doaj': False, 'is_core': False, 'host_organization': 'https://openalex.org/I4210145204', 'host_organization_name': 'DataCite', 'host_organization_lineage': ['https://openalex.org/I4210145204'], 'host_organization_lineage_names': ['DataCite'], 'type': 'metadata'}, 'license': None, 'license_id': None, 'version': None}], 'best_oa_location': {'is_oa': True, 'landing_page_url': 'https://arxiv.org/abs/2006.04750', 'pdf_url': None, 'source': {'id': 'https://openalex.org/S4306400194', 'display_name': 'arXiv (Cornell University)', 'issn_l': None, 'issn': None, 'is_oa': True, 'is_in_doaj': False, 'is_core': False, 'host_organization': 'https://openalex.org/I205783295', 'host_organization_name': 'Cornell University', 'host_organization_lineage': ['https://openalex.org/I205783295'], 'host_organization_lineage_names': ['Cornell University'], 'type': 'repository'}, 'license': 'other-oa', 'license_id': 'https://openalex.org/licenses/other-oa', 'version': 'submittedVersion', 'is_accepted': False, 'is_published': False}, 'sustainable_development_goals': [], 'grants': [], 'datasets': [], 'versions': [], 'referenced_works_count': 0, 'referenced_works': [], 'related_works': ['https://openalex.org/W4381094582', 'https://openalex.org/W2373256103', 'https://openalex.org/W2352149790', 'https://openalex.org/W2201908702', 'https://openalex.org/W2186092498', 'https://openalex.org/W2058252362', 'https://openalex.org/W2045049461', 'https://openalex.org/W1984630168', 'https://openalex.org/W1982687909', 'https://openalex.org/W1978893398'], 'abstract_inverted_index': {'Practitioners': [0], 'use': [1], 'feature': [2, 28, 32, 81, 88, 102, 125, 131, 158, 188], 'importance': [3, 29, 52], 'to': [4, 16, 48, 94, 110], 'rank': [5], 'and': [6, 19, 160], 'eliminate': [7], 'weak': [8], 'predictors': [9], 'during': [10], 'model': [11], 'development': [12], 'in': [13], 'an': [14, 38], 'effort': [15], 'simplify': [17], 'models': [18], 'improve': [20], 'generality.': [21], 'Unfortunately,': [22], 'they': [23, 128], 'also': [24, 141], 'routinely': [25], 'conflate': [26], 'such': [27], 'measures': [30, 86, 135], 'with': [31, 147, 186], 'impact,': [33], 'the': [34, 42, 95, 106, 119, 148, 171], 'isolated': [35], 'effect': [36], 'of': [37, 73, 87, 136, 157], 'explanatory': [39], 'variable': [40], 'on': [41, 105, 144, 170], 'response': [43], 'variable.': [44], 'This': [45], 'can': [46, 99], 'lead': [47], 'real-world': [49], 'consequences': [50], 'when': [51], 'is': [53, 70], 'inappropriately': [54], 'interpreted': [55], 'as': [56], 'impact': [57, 113, 137, 159], 'for': [58, 67, 80, 196], 'business': [59], 'or': [60, 138], 'medical': [61], 'insight': [62], 'purposes.': [63], 'The': [64, 90], 'dominant': [65], 'approach': [66], 'computing': [68], 'importances': [69], 'through': [71], 'interrogation': [72], 'a': [74], 'fitted': [75], 'model,': [76, 107], 'which': [77], 'works': [78], 'well': [79], 'selection,': [82], 'but': [83], 'gives': [84], 'distorted': [85], 'impact.': [89], 'same': [91, 96], 'method': [92], 'applied': [93], 'data': [97, 194], 'set': [98], 'yield': [100], 'different': [101], 'importances,': [103], 'depending': [104], 'leading': [108], 'us': [109], 'conclude': [111], 'that': [112, 167, 178], 'should': [114], 'be': [115], 'computed': [116], 'directly': [117, 169], 'from': [118, 163], 'data.': [120, 172], 'While': [121], 'there': [122], 'are': [123, 184], 'nonparametric': [124], 'selection': [126, 189], 'algorithms,': [127], 'typically': [129, 142], 'provide': [130], 'rankings,': [132], 'rather': [133], 'than': [134], 'importance.': [139], 'They': [140], 'focus': [143], 'single-variable': [145], 'associations': [146], 'response.': [149], 'In': [150], 'this': [151], 'paper,': [152], 'we': [153, 176], 'give': [154], 'mathematical': [155], 'definitions': [156, 183], 'importance,': [161], 'derived': [162], 'partial': [164], 'dependence': [165], 'curves,': [166], 'operate': [168], 'To': [173], 'assess': [174], 'quality,': [175], 'show': [177], 'features': [179], 'ranked': [180], 'by': [181], 'these': [182], 'competitive': [185], 'existing': [187], 'techniques': [190], 'using': [191], 'three': [192], 'real': [193], 'sets': [195], 'predictive': [197], 'tasks.': [198]}, 'cited_by_api_url': 'https://api.openalex.org/works?filter=cites:W4386564352', 'counts_by_year': [{'year': 2024, 'cited_by_count': 1}, {'year': 2023, 'cited_by_count': 1}, {'year': 2022, 'cited_by_count': 2}, {'year': 2021, 'cited_by_count': 2}, {'year': 2020, 'cited_by_count': 1}], 'updated_date': '2024-12-16T16:09:43.032669', 'created_date': '2023-09-10'}
Publication Information

Basic Information

Access and Citation

AI Researcher Chatbot

Primary Location

Authors

Topics

Keywords

Related Works