操作
バグ #472
未完了【親】レジュメ変換システム - ファイルアップロード・テキスト抽出機能
ステータス:
新規
優先度:
高め
担当者:
-
開始日:
2025-06-11
期日:
進捗率:
0%
予定工数:
説明
概要¶
レジュメ変換システムのファイルアップロードおよびテキスト抽出機能を実装します。PDF/DOCXファイルのアップロード、ファイル処理、テキスト抽出の一連の機能を実装します。
作業内容¶
-
ファイルアップロード機能実装
- フロントエンドのファイルアップロードコンポーネント実装
- ドラッグ&ドロップ対応
- ファイルタイプ・サイズバリデーション
- アップロード進捗表示
-
ファイル保存機能実装
- バックエンドでのファイル受信処理
- 一時ファイルの保存
- ファイルメタデータのDB保存
- ファイル命名規則の実装
-
PDFテキスト抽出実装
- PDF.jsの導入と設定
- PDFからのテキスト抽出処理
- 抽出テキストの前処理
- エラーハンドリング
-
DOCXテキスト抽出実装
- Mammoth.jsの導入と設定
- DOCXからのテキスト抽出処理
- 抽出テキストの前処理
- エラーハンドリング
-
ファイルプレビュー機能実装
- アップロードファイルのプレビュー表示
- PDFのページめくり機能
- DOCXのプレビュー表示
成果物¶
- ファイルアップロードコンポーネント
- ファイル保存APIエンドポイント
- PDFテキスト抽出モジュール
- DOCXテキスト抽出モジュール
- ファイルプレビュー機能
技術スタック¶
- フロントエンド: React Dropzone, PDF.js
- バックエンド: Multer, PDF.js, Mammoth.js
参照¶
操作