-
[OSS紹介#11] DocLayNet:画像解析の新しい可能性を広げる多様な文書レイアウトデータセット
in テックブログこの記事について このブログシリーズでは、注目すべきオープンソースソフトウェア(OSS)を定期的に紹介していま…
-
[論文紹介#266]DIVE:生成モデルを識別タスクに転用する研究
in テックブログDIVE: Inverting Conditional Diffusion Models for Discri…
-
[OSS紹介#10] DiT:文書画像に特化したトランスフォーマーモデルの力を探る
in テックブログこの記事について この記事では、注目のオープンソースソフトウェア(OSS)である「DiT」をご紹介します。この…
-
[論文紹介#265]大規模言語モデルの要約を活用したソースコードにおけるトピックモデリングの試み
in テックブログTowards Leveraging Large Language Model Summaries for T…
-
[OSS紹介#9] Detectron2:Facebookが開発した最先端の画像認識プラットフォームで物体検出からセグメンテーションまで実装
in テックブログこの記事について このブログシリーズでは、注目すべきオープンソースソフトウェア(OSS)を定期的に紹介していき…
-
[論文紹介#264]FRAG:NVIDIAが提案するフレーム選択による長時間ビデオ・長文文書理解の手法
in テックブログFRAG: Frame Selection Augmented Generation for Long Vid…
-
[OSS紹介#8] RT-DETRv2:論文実装!YOLOを超える高精度リアルタイム物体検出ツール
in テックブログこの記事について この記事では、注目のオープンソースソフトウェア(OSS)である「RT-DETR」を紹介します…
-
[論文紹介#263]RT-DETRv2: リアルタイム検出トランスフォーマーのための改善されたベースラインとバグ・オブ・フリービーズ
in テックブログRT-DETRv2: Improved Baseline with Bag-of-Freebies for R…
-
[OSS紹介#7] PARSeq:文書解析ツール4回目!シーンテキスト認識の新たな可能性を切り拓く
in テックブログこの記事について この記事では、オープンソースソフトウェア(OSS)の中でも特に注目される「PARSeq」を紹…
-
[OSS紹介#6] layout-parser:文書解析ツール3回目!使いやすさと機能性を兼ね備えたツールキット
in テックブログこの記事について この記事では、注目のオープンソースソフトウェア(OSS)「Layout-Parser」を紹介…