NDL-DocLデータセット(資料画像レイアウトデータセット)の変換と可視化

NDL Labが公開するNDL-DocLデータセット(資料画像レイアウトデータセット)について、Pascal VOC形式のXMLファイルをCOCO形式のJSONファイルへ変換し、その内容を可視化するノートブックを作成しました。 https://github.com/nakamura196/ndl_ocr/blob/main/NDL_DocLデータセット(資料画像レイアウトデータセット)の変換と可視化.ipynb 上記のノートブックを開き、「ランタイム」 > 「すべてのセルを実行」 を押すことで、変換と可視化を行うことができます。 実行後に作成される「/content/img」フォルダと「/content/dataset_kotenseki.json」ファイルを使用することで、COCO形式のデータが求められる機械学習プログラムに使用することができます。 参考になりましたら幸いです。

2022年7月22日 · 1 分 · Nakamura

二つのテキスト間の差分を抽出するプログラムを作成しました。

概要 二つのテキスト間の差分を抽出するプログラムを作成しました。以下のGoogle Colabからご利用いただけます。 https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/校異情報の生成.ipynb 有名なサービスとして「difff」がありますが、今回はPythonを用いて実装しています。 https://difff.jp/ テキスト間の差分の算出には、difflib.SequenceMatcherを使用しています。 https://docs.python.org/ja/3/library/difflib.html 使い方 出力方式として、HTMLファイルとTEIファイルの2種類を選ぶことができます。 HTML HTMLファイルの出力結果例は以下です。 XML XMLファイルの出力例は以下です。 <?xml version="1.0" encoding="utf-8"?> <?xml-model href="https://raw.githubusercontent.com/ldasjp8/tei-example/main/tei_all.rng" schematypens="http://relaxng.org/ns/structure/1.0" type="application/xml"?> <TEI xmlns="http://www.tei-c.org/ns/1.0"> <teiHeader> <fileDesc> <titleStmt> <title>Title</title> </titleStmt> <publicationStmt> <p>Publication</p> </publicationStmt> <sourceDesc> <listWit> <witness xml:id="t1">中村式五十音</witness> <witness xml:id="t2">中村式五十音又様</witness> </listWit> </sourceDesc> </fileDesc> </teiHeader> <text> <body> <p>あいうえお <lb/> <app xml:id="a1"> <lem wit="#t1">か</lem> <rdg wit="#t2">こけ</rdg> </app>きく <app xml:id="a2"> <lem wit="#t1">けこ</lem> <rdg wit="#t2">か</rdg> </app> <lb/> さしすせそ <lb/> た <app xml:id="a3"> <lem wit="#t1">ちぬ</lem> <rdg wit="#t2">じづ</rdg> </app>てと <app xml:id="a4"> <lem wit="#t1"/> <rdg wit="#t2"/> </app> </p> </body> </text> </TEI> 工夫した点として、TEI(Text Encoding Initiative)で定められているappタグを用いて出力します。そのため、appタグに対応したツールで可視化を行うことができます。 例えば、以下の「TEI Critical Apparatus Toolbox」を使用してみます。 http://teicat.huma-num.fr/witnesses.php ...

2022年7月14日 · 1 分 · Nakamura

Omeka ClassicをHeadless CMSとして使用してみる。

概要 Omeka SおよびOmeka Classicは、デジタルアーカイブ構築および人文(情報)学研究において、とても便利なツールです。 https://omeka.org/ REST APIを標準搭載し、モジュールおよびプラグインの追加などによる高い拡張性を持ちます。またIIIF関連ツール、翻刻支援ツール、時空間情報を取り扱うツールなど、さまざまな既存資産を利用することができます。 一方、サイトの見た目を変更するテーマ開発などについては、PHPおよびOmekaに対する知識が求められ、比較的難易度が高いと(個人的に)感じています。この点について、昨今はバックエンドとフロンドエンドを分離したHeadless CMSという使い方も普及しつつあります。 そこでOmeka ClassicをHeadless CMSとして使用し、Nuxt 3を用いたフロントエンド開発を試みました。Omekaの活用方法の一例として参考になれば幸いです。 Omeka Classicの準備 APIの有効化 以下を参考に、APIの有効化を行います。 https://omeka.org/classic/docs/Admin/Settings/API_Settings/ Access-Control-Allow-Originヘッダーの追加 .htaccessファイルにAccess-Control-Allow-Originヘッダーを追加します。 Header set Access-Control-Allow-Origin "*" # 追加 # Omeka .htaccess: Apache configuration file # This file is required for Omeka to function correctly. # --------------- # # Error Reporting # ... Omeka ClassicのAPI 以下のページにAPIがまとめられています。 https://omeka.readthedocs.io/en/latest/Reference/api/index.html 例えば、以下のようなURLから、アイテムに対する簡易な検索が可能です。(Omeka Classicでは詳細な検索ができないようです。本格的な利用にあたっては、Omeka Sを使用する必要がありそうです。) https://omeka.aws.ldas.jp/api/items?search=被 フロントエンドの開発 今回は勉強を兼ねて、Nuxt 3とVuetify 3を使ってみました。2022-07-08時点において、アプリの完成度は大変低いが、Omeka ClassicをHeadless CMSとして利用し得ることを確認できました。 https://omekac.netlify.app/ まとめ Omeka(SおよびClassic)を用いたシステム開発における一例として、参考になりましたら幸いです。 ...

2022年7月8日 · 1 分 · Nakamura

Mirador 3 による画像比較ツールを作成しました。

Mirador 3 による画像比較ツールを作成しました。URLは以下です。 https://ldas-jp.github.io/viewer/input/ またGitHubリポジトリのURLは以下です。 https://github.com/ldas-jp/viewer 以下が入力フォームです。比較する画像のIIIFマニフェストファイルのURLとCanvasのURIを指定します。「例」にあるボタンをクリックすることで、入力例をご確認いただけます。 「開く」ボタンをクリックすると、以下のようにMirador 3が起動します。入力情報に基づく画像比較を行うことができます。 Mirador 3を用いた画像比較にあたり、ご活用いただけますと幸いです。

2022年7月8日 · 1 分 · Nakamura

Omeka ClassicのIIIF Toolkitを用いたアノテーションの一括登録方法

はじめに 備忘録的な意味合いの強い記事です。わかりにくい点も多々あるかと思いますが、ご容赦ください。 特に以下で紹介されている、IIIF Toolkitが使用するアノテーションエンドポイントの使い方について、参考になりましたら幸いです。 https://github.com/utlib/IiifItems/wiki/The-Mirador-Omeka-Annotator-Endpoint 概要 Omeka ClassicのIIIF Toolkitプラグインは、IIIFマニフェストファイルの読み込みや、画像へのアノテーションを行うことができるとても便利なツールです。 https://zenn.dev/nakamura196/books/2a0aa162dcd0eb/viewer/b37a8c 今回は、Omeka Classicとは独立して作成されたアノテーションデータを持っていることを前提として、それらのアノテーションをOmeka Classicに一括登録する方法を記事にします。 以下のGooble Colabのノートブックを用意しています。参考になりましたら幸いです。 https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/Omeka_ClassicのIIIF_Toolkitを用いたアノテーションの一括登録方法.ipynb 使い方 事前準備0 上記のノートブックを実行する前に、Omeka ClassicのAPIの有効化、およびAPIキーの発行を行う必要があります。 Omeka ClassicのAPIの有効化 以下に示すように、デフォルトではOFFになっているAPIの有効化を行います。 APIキーの発行 非公開のアイテムについては、APIキーを用いたアクセスが必要になるため、ユーザ毎にAPIキーを発行します。 ノートブックの実行 上記のノートブックに従って、Omeka ClassicのAPIを用いたデータ登録を行います。 結果 以下に示すように、アノテーションが一括登録されていることが確認できます。 まとめ Omeka ClassicのIIIF Toolkitが提供するAPIの扱い方など、参考になりましたら幸いです。

2022年7月8日 · 1 分 · Nakamura

NDL OCRでルビのテキスト化を行えるようにしていただきました。

概要 NDL OCRについて、これまではルビのテキスト化を行わない設定がデフォルトでした。これに対して、NDLの方々のご協力により、テキスト化を行うか否かを設定できるようにしていただきました。 https://github.com/ndl-lab/ndlocr_cli/ config.yamlの以下をTrueにするとルビのテキスト化機能が動作します。 yield_block_rubi: False また、以下の留意事項があるとのことです。ご利用される際はご注意ください。 必ずしもルビの振られた漢字の箇所で切れるわけではなく、複数箇所のルビがマージされて出力されてしまうことも多い ルビは字のサイズが小さいことから、〓になってしまうことも多い チュートリアル用のノートブックの更新 ルビのテキスト化オプションについて、チュートリアル用のGoogle Colabにも追加しました。 https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/ndl_ocr_v2.ipynb rubyというオプションにチェックを入れると、ルビのテキスト化を行います。デフォルトでは、従来通りFalse(ルビのテキスト化は行わない設定)にしています。 また今回の機能追加に合わせて、PDFを入力とした際の不具合修正や、認識結果の出力方法の変更等を行いました。認識結果を保存したGoogleドライブへのリンクを出力し、リンク先で認識結果を確認する方法に統一しました。 操作方法については、今回の修正内容は含まれていませんが、以下のデモ動画を用意しています。Google Colabの使い方など、参考になりましたら幸いです。 https://youtu.be/46p7ZZSul0o

2022年7月6日 · 1 分 · Nakamura

Omeka S Bulk Importの不具合と改善

Omeka Sでアイテムやメディアの一括登録を行うためのBulk Importモジュールについて、version 3.3.28.0から3.3.33.2において、メディアを登録できない不具合があります。メディアの登録が必要な場合は、とりあえずversion 3.3.27.0以前のモジュールを使用するなど、回避策が必要です。 ただ、本件についてIssueを作成したところ、早速不具合を修正いただきました。 https://gitlab.com/Daniel-KM/Omeka-S-module-BulkImport/-/issues/10 7/1時点ではGitLab上のソースコードのみが修正された状態ですが、近くGitHubのReleasesにも追加されると思います。本モジュールをお使いの際はご注意ください。 なお、GitLabのソースコードからインストールする場合には、こちらのREADMEをご確認ください。具体的には、modulesディレクトリに移動して、以下のようなコマンドを実行します。 $ cd modules/ $ git clone https://gitlab.com/Daniel-KM/Omeka-S-module-BulkImport.git BulkImport Cloning into 'BulkImport'... remote: Enumerating objects: 7580, done. remote: Counting objects: 100% (1627/1627), done. remote: Compressing objects: 100% (746/746), done. remote: Total 7580 (delta 1056), reused 1163 (delta 750), pack-reused 5953 Receiving objects: 100% (7580/7580), 8.08 MiB | 20.02 MiB/s, done. Resolving deltas: 100% (5095/5095), done. $ cd BulkImport/ $ composer install --no-dev Installing dependencies from lock file Verifying lock file contents can be installed on current platform. Package operations: 12 installs, 0 updates, 0 removals - Downloading composer/installers (v2.1.1) - Downloading oomphinc/composer-installers-extender (2.0.1) - Downloading box/spout (v3.3.0) - Downloading codemirror/codemirror (5.65.1) - Downloading flowjs/flow-php-server (v1.0.3) - Downloading flowjs/flow.js (2.14.1) - Downloading hakre/xmlreaderiterator (v0.1.11) - Downloading mikehaertl/php-tmpfile (1.2.1) - Downloading mikehaertl/php-shellcommand (1.6.4) - Downloading mikehaertl/php-pdftk (0.9.2) - Downloading mtdowling/jmespath.php (2.6.1) - Downloading phpoffice/phpword (0.18.3) - Installing composer/installers (v2.1.1): Extracting archive - Installing oomphinc/composer-installers-extender (2.0.1): Extracting archive - Installing box/spout (v3.3.0): Extracting archive - Installing codemirror/codemirror (5.65.1): Extracting archive - Installing flowjs/flow-php-server (v1.0.3): Extracting archive - Installing flowjs/flow.js (2.14.1) - Installing hakre/xmlreaderiterator (v0.1.11): Extracting archive - Installing mikehaertl/php-tmpfile (1.2.1): Extracting archive - Installing mikehaertl/php-shellcommand (1.6.4): Extracting archive - Installing mikehaertl/php-pdftk (0.9.2): Extracting archive - Installing mtdowling/jmespath.php (2.6.1): Extracting archive - Installing phpoffice/phpword (0.18.3): Extracting archive Package box/spout is abandoned, you should avoid using it. No replacement was suggested. Generating autoload files 1 package you are using is looking for funding. Use the `composer fund` command to find out more! BulkImportの利用にあたり、参考になりましたら幸いです。 ...

2022年7月1日 · 2 分 · Nakamura

Omeka Classicのデータをダウンロードするプログラムを作成しました。

Omeka Classicのデータをダウンロードするプログラムを作成しました。以下のリポジトリで公開しています。 https://github.com/nakamura196/omekac_backup また、本プログラムの実行例を示すGoogle Colabを作成しました。 https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/omeka_classic_backup.ipynb 上記のチュートリアルでは、以下のOmeka Classicのサイトを対象に、データのダウンロードを実行します。 https://jinmoncom2017.omeka.net/ 実行後、docsフォルダにapiのダウンロード結果が出力されます。 上記のデータをバックアップ等にご利用いただけます。Omeka Classicを利用される際の参考になりましたら幸いです。

2022年6月23日 · 1 分 · Nakamura

Omeka Sのデータをダウンロードするプログラムを作成しました。

Omeka Sのデータをダウンロードするプログラムを作成しました。以下のリポジトリで公開しています。 https://github.com/nakamura196/omekas_backup また、本プログラムの実行例を示すGoogle Colabを作成しました。 https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/omekas_backup.ipynb 上記のチュートリアルでは、以下のOmeka Sのサンドボックスを対象に、データのダウンロードを実行します。 https://omeka.org/s/download/#sandbox 実行後、docsフォルダにapiのダウンロード結果、dataフォルダにそれらをまとめたMS Excelファイルが出力されます。 上記のデータをバックアップ等にご利用いただけます。Omeka Sを利用される際の参考になりましたら幸いです。

2022年6月22日 · 1 分 · Nakamura

Nuxt 3とVuetify 3を用いたIIIF Image API関連ツールを作成しました。

概要 Nuxt 3とVuetify 3を用いたIIIF Image API関連ツールを作成しました。本ツールを開発した背景として、IIIF Image APIを操作するニーズに加えて、Nuxt 3の使い方を学ぶ目的がありました。 GitHubリポジトリは以下です。参考になりましたら幸いです。 https://github.com/nakamura196/nuxt3-vuetify3 使い方 以下のURLからアクセスいただけます。 https://nv3.netlify.app/ 以下のように、「例」ボタンを押すと、画面上部のテキストフォームにURLが入力され、そのURLに含まれる要素(「region」や「size」など)が画面下部に表示されます。 IIIF Image APIを操作する際の参考になりましたら幸いです。

2022年6月7日 · 1 分 · Nakamura

【Omeka S モジュール】IIIF ServerモジュールでImage APIを使用しない方法

概要 IIIFマニフェストの生成を行うOmeka Sのモジュール「IIIF Server」において、Image APIを使用しない設定を行うことができます。これにより、レンタルサーバなどのリソースが限られた環境において、IIIFマニフェストの配信などが容易となります。 以前、以下の記事を執筆しました。 https://nakamura196.hatenablog.com/entry/2021/07/22/171657 2022年5月時点において、モジュールのアップデートにより、設定の方法が変わりましたので、設定方法をあらためて記事にします。なお、Image APIを使用しないメリットやデメリットについては、上記の記事をご参照ください。 設定方法 確認した環境は以下です。 Omeka S version 3.2.0 IIIF Server version 3.6.6.6 モジュールの一覧画面から「IIIF Server」をみつけ、「設定」ボタンをクリックします。 遷移先のページで最下部に移動すると、「External image server」 > 「Default IIIF image api version」という設定項目があります。ここで以下に示すように、「No image server」のオプションを選択することにより、Image APIを使用しないマニフェストファイルの生成が可能になります。 まとめ レンタルサーバなどのリソースが限られた環境でOmekaを運用しており、タイル画像の生成に時間がかかってしまう場合などに、本記事が参考になりましたら幸いです。

2022年5月27日 · 1 分 · Nakamura

【Omeka S Theme】Bootstrap 5テーマのMappingモジュール一部対応

概要 以下のBootstrap 5を用いたOmeka Sのテーマについて、後述するように、Mappingモジュールをインストールした際、map-browseページで表示崩れが発生していました。 https://github.com/ldasjp8/Omeka-S-theme-Bootstrap5 上記について、以下のように修正しました。 https://github.com/ldasjp8/Omeka-S-theme-Bootstrap5/commit/d60c93ff6d79b5505d25ef26e31e3776f55199d4 修正前 地理関係のフォームの表示が崩れていました。 修正後 地理関係のフォームの表示崩れを修正しました。 まとめ まだまだ表示が崩れてしまうページやモジュールがありますが、順次対応していきたいと思います。

2022年5月26日 · 1 分 · Nakamura

【Omeka S】IIIF対応の複数ビューアを設置する「IIIF Viewers」モジュールの使い方

概要 Omeka SにIIIF マニフェスト URI のアイコンとビューアを表示するためのモジュール「IIIF Viewers」を開発・公開しています。本モジュールの開発にあたっては、国文学研究資料館にご協力いただきました。 https://github.com/omeka-j/Omeka-S-module-IiifViewers 以下、本モジュールの使い方について説明します。 インストール Omeka Sにおける標準的な方法でインストール可能です。 具体的には、まず以下の「Releases」欄のリンクをクリックします。 次に、以下のリンクをクリックすることで、zipファイルをダウンロードできます。ダウンロードしたファイルを展開して、インストール済みのOmeka Sの「modules」フォルダに展開したフォルダ「IiifViewers」を配置してください。 本記事執筆時点では、以下のURLで最新版をダウンロードすることができます。 https://github.com/omeka-j/Omeka-S-module-IiifViewers/releases/download/0.0.5/IiifViewers.zip 使い方 インストール後、以下の設定画面に遷移します。本モジュールで使用する各種IIIF対応ビューアへのリンクを指定することができます。(デフォルト設定のままでも問題ありません。) また、画面左部の「モジュール > IIIF Viewers」のリンクをクリックすることで、各ビューアのアイコンを指定することができます。 カスタマイズ例 たとえば、「TIFY」を設定している箇所について、神崎正英氏が開発されている「Image Annotator」に変更してみます。 https://www.kanzaki.com/works/2016/pub/image-annotator まず以下の画面から、ロゴを変更します。 次に、モジュールの一覧画面から、以下の「設定」ボタンを選択します。 そして、「TIFY」のURLの値を以下に変更します。 http://www.kanzaki.com/works/2016/pub/image-annotator?u= 結果、以下のように追加したアイコンが表示され、アイコンをクリックすると、Image Annotatorで画像を閲覧することができます。 まとめ 今後、任意の数のIIIF対応ビューアを設定できるように修正したいと思います。 新機能やバグ修正のご要望などございましたらお知らせください。またプルリクエストも歓迎いたします。 ご活用いただけますと幸いです。

2022年5月26日 · 1 分 · Nakamura

Omeka SにDC-NDL(国立国会図書館ダブリンコアメタデータ記述)を語彙として登録する

Omeka SにDC-NDL(国立国会図書館ダブリンコアメタデータ記述)を語彙として登録する方法です。 まず、以下のように、「語彙の一覧」を選択します。 次に、右上の「人間が理解できる語彙のタイトル。」ボタンをクリックします。(こちらは翻訳データが間違っています。今後修正したいと思います。) そして、以下の画面に示すように、必要な情報を入力します。 具体的な情報は以下です。 大項目 小項目 値 備考 基本情報 ラベル DC-NDL この値は任意です。 基本情報 名前空間URI http://ndl.go.jp/dcndl/terms/ 基本情報 名前空間の接頭語 dcndl ファイル 語彙URL https://www.ndl.go.jp/jp/dlib/standards/meta/2020/12/ndl-terms.rdf 結果、以下のように、DC-NDLが語彙として利用可能になります。 他のRDFスキーマについても同様の方法で登録可能です。参考になりましたら幸いです。

2022年5月25日 · 1 分 · Nakamura

Nuxt 2を用いたMirador 3の使用例を紹介するGitHubリポジトリの修正

Nuxt 2を用いたMirador 3の使用例を以下のGitHubリポジトリで紹介しています。 https://github.com/nakamura196/nuxt-mirador ただ上記のリポジトリにおいて、production環境において不具合が生じることがわかりました。具体的には、ページ遷移後にMiradorの表示が崩れてしまう不具合です。 送っていただいたissue https://github.com/nakamura196/nuxt-mirador/issues/1 このissueについて、さらに不具合を修正したPull requestも送っていただきました。 https://github.com/nakamura196/nuxt-mirador/pull/2 具体的には、以下に示すように、beforeDestroyでunmountする必要がありました。 https://github.com/nakamura196/nuxt-mirador/pull/2/files 自分では不具合の解消方法が分かりかねたので、大変助かりました。 Nuxt(Vue)におけるMirador 3の使用において、参考になりましたら幸いです。

2022年5月1日 · 1 分 · Nakamura

Google Colabを用いたジャパンサーチRDFストアに対するSPARQLの実行例

Google Colabを用いたジャパンサーチRDFストアに対するSPARQLの実行例を示すノートブックを作成しました。Pythonを用いたRDFストア利用時の参考になりましたら幸いです。 https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/ジャパンサーチのRDFストアを対象したSPARQLチュートリアル.ipynb 他にも以下のような参考サイト・チュートリアルがあります。 https://www.kanzaki.com/works/ld/jpsearch/ https://lab.ndl.go.jp/data_set/tutorial/

2022年4月29日 · 1 分 · Nakamura

CSVファイルを用いたresearchmap業績の新規登録・更新・削除方法

概要 researchmapの業績について、CSVファイルを用いた新規登録・更新・削除を行いました。本記事では、その方法と使用したデータを共有します。 今回使用したサンプルデータ https://github.com/ldasjp8/researchmap 新規登録 まず「インポート」ボタンをクリックします。 インポートダイアログが表示されるため、新規登録用のcsvファイルを選択して、「整合性チェック」ボタンを押します。 登録するcsvファイルの例を以下に格納しました。「published_papers」へ新規登録を行う例です。 https://github.com/ldasjp8/researchmap/blob/main/create.csv 公式の「CSV項目定義書」やCSVファイルのサンプルは以下で取得できます。 https://researchmap.jp/public/other-document/specification 結果、「処理待ち」のタスクが登録されます。 少し待って「更新」ボタンを押すと、以下のように整合性チェックが終了します。「こちらよりチェック結果を確認」リンクをクリックします。 以下の画面に遷移後、「インポート」ボタンを押します。 再び「処理待ち」のタスクが登録されます。 少し待って「更新」ボタンを押すと、以下のようにインポートが終了します。 「論文」の一覧ページでも、新規に登録されていることを確認できます。 なお、以降の「更新」「削除」においては、登録した業績のIDが必要になります。今回登録した業績のIDは36765885でした。このIDは、登録した個々の業績のURLなどから確認することができます。 また、既に登録済みの業績のIDを一括取得する場合は、「エクスポート」機能などを用います。 更新 新規登録と同様、「インポート」機能を用いて、更新用のCSVファイルを登録します。 更新用のcsvファイルの例を以下に格納しました。 https://github.com/ldasjp8/researchmap/blob/main/update.csv ポイントとして、アクションタイプに「similar_merge」、類似業績マージ優先度に「input_data」、IDに先ほど取得した業績のIDを入力しています。 これらを行いたいことに対して適切に設定しないと、類似業績などによって整合性チェックでエラーが発生する可能性があります。 以下のCSV項目定義書のページが参考になります。 https://researchmap.jp/outline/v2api/v2CSV.pdf#page=7 以下のようにタスクが登録されます。 少し待って「更新」ボタンを押すと、以下のように整合性チェックが終了します。「こちらよりチェック結果を確認」リンクをクリックします。 以下の画面に遷移後、「インポート」ボタンを押します。 少し待って「更新」ボタンを押すと、以下のようにインポートが終了します。 以下のように、先ほど登録した業績の情報が更新されます。 削除 これまでと同様、「インポート」機能を用いて、削除用のCSVファイルを登録します。削除用のcsvファイルの例を以下に格納しました。 https://github.com/ldasjp8/researchmap/blob/main/delete.csv CSVファイルの登録後、少し待って「更新」ボタンを押すと、以下のように整合性チェックが終了します。「こちらよりチェック結果を確認」リンクをクリックします。 以下の画面に遷移後、「インポート」ボタンを押します。 少し待って「更新」ボタンを押すと、以下のようにインポートが終了します。 業績のページにアクセスしてみることで、業績が正しく削除されていることを確認できます。 まとめ researchmapの業績に対する一括登録や更新、削除を行う際の参考になりましたら幸いです。

2022年4月15日 · 1 分 · Nakamura

「NDL OCR x IIIF」アプリにTEI/XML形式でダウンロードする機能を追加しました。

国立国会図書館「次世代デジタルライブラリー」で公開されているOCR結果をIIIFビューアで閲覧するアプリについて、OCR結果をTEI/XML形式でダウンロードする機能を追加しました。 https://static.ldas.jp/ndl-ocr-iiif/ 本アプリについては、以下の記事も参考にしてください。 本機能の追加にあたり、UIを更新しました。結果を「ビューア」と「データ」に分けています。 「ビューア」については、従来から提供していた「Mirador」と「Curation Viewer」に加えて、「Universal Viewer」、「Image Annotator」を追加しました。また、「次世代デジタルライブラリー」へのリンクと、TEI/XMLファイルの簡易ビューアとして「TEI Viewer」というページを実装して追加しています。 「データ」については、「マニフェストファイル」「キュレーションリスト」「TEI/XML」の3種類を提供します。 用途に応じてご活用いただけますと幸いです。

2022年4月15日 · 1 分 · Nakamura

Vue3でOpenSeadragonを使用するサンプルリポジトリを作成しました。

Vue3でOpenSeadragonを使用するサンプルリポジトリを作成しました。 以下が動作例です。 https://static.ldas.jp/vue3-osd/ ソースコードは以下です。 https://github.com/ldasjp8/vue3-osd Vue3初学者のため、誤りなどがあるかもしれませんが、参考になりましたら幸いです。

2022年4月14日 · 1 分 · Nakamura

【Omeka S】IIIF Serverモジュールにおける独自識別子の設定方法

Omeka SのIIIF Serverモジュールについて、デフォルト設定では、以下のようなURLでIIIFマニフェストファイルにアクセスすることができます。 <インストールしたパス>/iiif/<presentation apiのバージョン>/<omekaの内部ID>/manifest 例(version 2の場合): https://shared.ldas.jp/omeka-s/iiif/2/1267/manifest 例(version 3): https://shared.ldas.jp/omeka-s/iiif/3/1267/manifest ただ、このままではOmekaの内部IDが使用されてしまうため、独自の識別子の利用を推奨します。 対応方法としては、Clean Urlモジュールを追加でインストールし、以下に示すIIIF Serverモジュールの設定画面において、Use the identifiers from Clean Urlを有効にします。 これにより、例えば、先のサイテムに99999という識別子を与えた場合、以下のURLでも同じマニフェストファイルにアクセスすることができます。 https://shared.ldas.jp/omeka-s/iiif/2/99999/manifest 今回は数字の識別子を与えましたが、abcやabc1234など、英数字などでも問題ありません。 IIIF Serverモジュールを利用される際の参考になりましたら幸いです。

2022年4月11日 · 1 分 · Nakamura