プロジェクト

全般

プロフィール

バグ #472

未完了

【親】レジュメ変換システム - ファイルアップロード・テキスト抽出機能

Redmine Admin さんが8日前に追加. 8日前に更新.

ステータス:
新規
優先度:
高め
担当者:
-
開始日:
2025-06-11
期日:
進捗率:

0%

予定工数:

説明

概要

レジュメ変換システムのファイルアップロードおよびテキスト抽出機能を実装します。PDF/DOCXファイルのアップロード、ファイル処理、テキスト抽出の一連の機能を実装します。

作業内容

  1. ファイルアップロード機能実装

    • フロントエンドのファイルアップロードコンポーネント実装
    • ドラッグ&ドロップ対応
    • ファイルタイプ・サイズバリデーション
    • アップロード進捗表示
  2. ファイル保存機能実装

    • バックエンドでのファイル受信処理
    • 一時ファイルの保存
    • ファイルメタデータのDB保存
    • ファイル命名規則の実装
  3. PDFテキスト抽出実装

    • PDF.jsの導入と設定
    • PDFからのテキスト抽出処理
    • 抽出テキストの前処理
    • エラーハンドリング
  4. DOCXテキスト抽出実装

    • Mammoth.jsの導入と設定
    • DOCXからのテキスト抽出処理
    • 抽出テキストの前処理
    • エラーハンドリング
  5. ファイルプレビュー機能実装

    • アップロードファイルのプレビュー表示
    • PDFのページめくり機能
    • DOCXのプレビュー表示

成果物

  • ファイルアップロードコンポーネント
  • ファイル保存APIエンドポイント
  • PDFテキスト抽出モジュール
  • DOCXテキスト抽出モジュール
  • ファイルプレビュー機能

技術スタック

  • フロントエンド: React Dropzone, PDF.js
  • バックエンド: Multer, PDF.js, Mammoth.js

参照

  • 親チケット: #468
  • 要件定義・設計: #469
  • バックエンド基盤: #470
  • フロントエンド基盤: #471

他の形式にエクスポート: Atom PDF