[6] データは CC BY-SA または CC BY-NC-SA で提供されています >>1。 (出典ごとに違います。 [7] >>4 から一括ダウンロードできますが、 とすごく大きな ZIP ファイルなので要注意です。 細切れで提供されても面倒なので一括ダウンロードできるのはありがたいですが、 ファイルサイズ故に取り回しがしづらいところはあります。 [8] ライセンス が混在しているのが厄介ですが、 ライセンス ごとに配布ファイルがわかれているので扱いやすくありがたいです。 普通は CC BY-SA の方だけ使うとトラブルを避けられます。 人文学研究データリポジトリは、情報・システム研究機構・データサイエンス共同利用基盤施設・ 人文学オープンデータ共同利用センター の学術情報リポジトリです。 研究成果やCODHセミナーの資料などを、このリポジトリを通して随時公開いたします。 篆書字体データセットの一部の画像が表示できない不具合があったため、字形画像データの一部を更新しました。 文字種数や文字数には変更ありません。 篆書字体データセットは、印文解読に有用と思われる和漢の字書・字彙類から切り出した篆書字体画像を、機械学習に利用しやすい形式で提供するデータセットです。 データセットをご利用の際には、http://codh.rois.ac.jp/tensho/から、ライセンス、利用ガイドラインなどを必ずご確認ください。 2021-03-31データセット公開:篆書体7,681文字種の文字画像データ106,447文字篆書字体データセットは、印文解読に有用と思われる和漢の字書・字彙類から切り出した篆書字体画像を、機械学習に利用しやすい形式で提供するデータセットです。
Kristen Michelle (@kristenworldwide) • Instagram photos and videos
2021年3月31日、人文学オープンデータ共同利用センター(CODH)が、「篆書字体データセット」の公開を発表しました。 IIIFで公開されている字書・字彙類に記された篆書字体画像の、所在情報とメタデータがまとめられています。
本システムは、単漢字検索、部首検索によって篆書の字形を探しやすくすることを企図したものです。 部首検索については、複数の漢字構造をスペースでつなげることで絞り込み検索にも対応しています。 検索結果一覧に示されるリンクアイコンをクリックすると、『漢篆千字文』『偏類六書通』は国立国会図書館デジタルコレクションへ、「蔵書印DB」は「蔵書印データベース」へ遷移します。 ブラウザの幅によっては、それぞれ「千字文」「六書通」「蔵書印」と省略表示します。 検索結果に 「篆書字体データセット」 で公開中の文字画像データがある場合は、画像を一覧表示します。
篆書字体データセットは、印文解読に有用と思われる和漢の字書・字彙類から切り出した篆書(てんしょ)字体画像を、機械学習に利用しやすい形式で提供します。 篆書字体データセット | ROIS-DS人文学オープンデータ共同利用センター (CODH) 『篆書字体データセット』(国文学研究資料館 が複数の機関から収集/ 情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター ・ 一般財団法人 人文情報学研究所 加工)は クリエイティブ・コモンズ 表示 – 継承 4.0 国際 ライセンス(CC BY-SA) の下に提供されています。 【公開】篆書字体データセットのバージョン2を公開しました。 国立国会図書館、京都大学人文科学研究所、早稲田大学図書館が所蔵する5点の資料を追加し、文字種は7,681→13,213に、文字数は106,448→180,898へと増えました。