日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita

はじめに 最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は、英数字に加えて、ひらがな、漢字、記号など数千種類の文字を識別する必要があったり、縦書きなど日本語ドキュメント特有のレイアウトに対処する必要があったりと日本語特有の難しさがあります。 ですが、今後、海外の開発者がこれらの課題に対処するため、日本のドキュメント画像解析に特化したものをリリースする可能性は低く、やはり自国の言語向けのサービスは

情報源: 日本語に特化したOCR、文書画像解析Pythonパッケージ「YomiToku」を公開しました|Kotaro.Kinoshita

コーデュラ(R)バリスティックナイロンの大容量リュック|イライラを解消する“上下2部屋構造”大きなリュック【seoWe[セオウィー]|コーデ – カワニシカバン – ながく愛されるものづくり

情報源: コーデュラ(R)バリスティックナイロンの大容量リュック|イライラを解消する“上下2部屋構造”大きなリュック【seoWe[セオウィー]|コーデ – カワニシカバン – ながく愛されるものづくり

Llama3.2をローカル環境(macOS)でサクッと動かしてみる #LLM – Qiita

Llama 3.2をローカル環境で動かしてみたはじめに先日Meta社より発表があったLlama 3.2を動かしてみました。Llama 3.2は前バージョンから大幅に改善され、特に小規模モデルの性…

情報源: Llama3.2をローカル環境(macOS)でサクッと動かしてみる #LLM – Qiita