mSCAN - a Multilingual Dataset for Compositional Generalization Evaluation

Reymond, Amélie Thu Tâm

mSCAN - a Multilingual Dataset for Compositional Generalization Evaluation

dc.contributor.advisor	Steinert-Threlkeld, Shane
dc.contributor.author	Reymond, Amélie Thu Tâm
dc.date.accessioned	2025-08-01T22:26:06Z
dc.date.issued	2025-08-01
dc.date.submitted	2025
dc.description	Thesis (Master's)--University of Washington, 2025
dc.description.abstract	Language models achieve remarkable results on a variety of tasks, yet still struggle on compositional generalization benchmarks. The majority of these benchmarks evaluate performance in English only, leaving open the question of whether these results generalize to other languages. As an initial step to answering this question, we introduce mSCAN, a multilingual adaptation of the SCAN dataset covering Mandarin Chinese, French, Hindi and Russian. It was produced by a rule-based translation, developed in cooperation with native speakers. We then showcase this dataset on some in-context learning experiments on multiple open-source multilingual models.
dc.embargo.lift	2027-07-22T22:26:06Z
dc.embargo.terms	Restrict to UW for 2 years -- then make Open Access
dc.format.mimetype	application/pdf
dc.identifier.other	Reymond_washington_0250O_28510.pdf
dc.identifier.uri	https://hdl.handle.net/1773/53674
dc.language.iso	en_US
dc.rights	none
dc.subject	Compositional generalization
dc.subject	Cross Linguistic Evaluation
dc.subject	Large Language Models Evaluation
dc.subject	Linguistics
dc.subject	Computer science
dc.subject	Artificial intelligence
dc.subject.other	Linguistics
dc.title	mSCAN - a Multilingual Dataset for Compositional Generalization Evaluation
dc.type	Thesis

Collections

Linguistics

mSCAN - a Multilingual Dataset for Compositional Generalization Evaluation

Files

Collections