数据集:
hebrew_this_world
语言:
计算机处理:
monolingual大小:
1K<n<10K语言创建人:
found批注创建人:
expert-generated源数据集:
original许可:
HebrewThisWorld 是一个数据集,包含了由Uri Avnery编辑的报纸《This World》的2028期,发行于1950年至1989年之间。该数据集采用AGPLv3许可发布。
数据注释:
语言建模
希伯来语
以“,”为分隔符的csv文件
示例:
{
"issue_num": 637,
"page_count": 16,
"date": "1950-01-01",
"date_he": "1 בינואר 1950",
"year": "1950",
"href": "https://thisworld.online/1950/637",
"pdf": "https://olam.eu-central-1.linodeobjects.com/pdfs/B-I0637-D010150.pdf",
"coverpage": "https://olam.eu-central-1.linodeobjects.com/pages/637/t-1.png",
"backpage": "https://olam.eu-central-1.linodeobjects.com/pages/637/t-16.png",
"content": "\nלפיד\nהנוער ־ בירושלים צילומים :\n\nב. רותנברג\n\nוזהו הלפיד\n...",
"url": "https://thisworld.online/api/1950/637"
}
| train | |
|---|---|
| corpus | 2028 |
[需要更多信息]
[需要更多信息]
源语言制作者是谁?[需要更多信息]
[需要更多信息]
注释者是谁?研究人员
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
GNU AGPLv3+
这是自由软件,您可以在一定条件下重新分发它。
本程序是自由软件:您可以依照自由软件基金会颁布的GNU Affero General Public License条款的版本3或(您可以选择)任何以后版本的条件,自由地获取、使用和重新分发此程序。
此程序是基于有用性,在没有明示或暗示的情况下提供,但没有任何担保。详见GNU Affero General Public License获取更多详细信息。
如果你没有收到GNU Affero General Public License的副本,请参阅 http://www.gnu.org/licenses/ 。
感谢 @lhoestq 和 @imvladikon 提供此数据集。