数据集:

Atsushi/fungi_trait_circus_database

语言:

en ja

计算机处理:

multilingual

大小:

100K<n<1M

批注创建人:

other

源数据集:

original

许可:

cc-by-4.0
英文

fungi_trait_circus_database 大菌輪「Trait Circus」数据集(统制形态) 最终更新日期:2022/12/26 ====

语言

日语和英语

请暂时不要将此数据集用于学术目的(仅限非正式使用) 当前暂不适用于学术目的使用。

概述

在个人网站 大菌輪 中,Atsushi Nakajima(中岛纯志)使用自然语言处理方法对真菌的描述文字进行半自动处理,提取与真菌形态、生态等相关的各种“形态(traits)”数据,以预先设定的“控制词(controlled term)”的形式进行整理,以方便统计和分析。 抽取方法已在《Niche Life》杂志中报告 こちらの記事 (未经同行评审)。 请注意,由于自动抽取的性质,可能会包含一定程度的错误。

控制词由“要素(element)”、“属性(attribute)”和“值(value)”三元组组成。 例如,“傘_色_黒”分别具有“傘”、“色”和“黒”的要素/属性/值。 在部分控制词中,要素和属性相同(如“生境”)。 供参考,前三个数据的要素为“子实体”、“傘”、“胞子”,属性为“颜色”、“形状”、“表面特征”,值为“褐色”、“光滑”、“黄色”。

此外,为了学习真菌分类学和辅助鉴定的目的,提供了基于这些数据的交互式可视化Web应用程序“ Trait Circus ”。 此数据集相当于该Web应用程序的原始数据,并包含未在Web应用程序中反映的信息,以适应容量等问题。

相关数据集

“论文3行总结” Atsushi/fungi_indexed_mycological_papers_japanese 、“识别形态总结” Atsushi/fungi_diagnostic_chars_comparison_japanese

各列说明

  • source...各信息的来源URL,大部分参考学术文献或MycoBank的描述文数据库
  • hit_term...提取的形态在来源中的表述
  • current_name...具有该形态的真菌的当前学名,参考MycoBank,但可能不是最新信息。
  • element_j...“要素”的日语表述
  • attribute_j...“属性”的日语表述
  • value_j...“值”的日语表述
  • element...“要素”的英语表述
  • attribute...“属性”的英语表述
  • value...“值”的英语表述