数据集:
mstz/toxicity
来自 UCI ML repository 的 Toxicity dataset 。该数据集包括171个分子,设计用于核心时钟蛋白CRY1的功能域,该蛋白负责产生昼夜节律。
| Configuration | Task | Description |
|---|---|---|
| toxicity | Binary classification | Is the molecule toxic? |
from datasets import load_dataset
dataset = load_dataset("mstz/toxicity")["train"]