Benchmarks as Microscopes: A Call for Model Metrology

Jan 1, 2024·

Michael Saxon

,

Ari Holtzman

,

Peter West

,

William Yang Wang

Naomi Saphra

Naomi Saphra

· 0 min read

Type

Conference paper

Publication

Conference on Language Modeling (COLM)

Last updated on Jan 1, 2024

Large Language Models Evaluation Position

Naomi Saphra

Authors

Research Fellow

← Attribute Diversity Determines the Systematicity Gap in VQA Jan 1, 2024

Causation Does Not Imply Correlation: A Study of Circuit Mechanisms and Model Behaviors Jan 1, 2024 →