プロジェクト

全般

プロフィール

バグ #472

未完了

【親】レジュメ変換システム - ファイルアップロード・テキスト抽出機能

Redmine Admin さんが8日前に追加. 8日前に更新.

ステータス:
新規
優先度:
高め
担当者:
-
開始日:
2025-06-11
期日:
進捗率:

0%

予定工数:

説明

概要

レジュメ変換システムのファイルアップロードおよびテキスト抽出機能を実装します。PDF/DOCXファイルのアップロード、ファイル処理、テキスト抽出の一連の機能を実装します。

作業内容

  1. ファイルアップロード機能実装

    • フロントエンドのファイルアップロードコンポーネント実装
    • ドラッグ&ドロップ対応
    • ファイルタイプ・サイズバリデーション
    • アップロード進捗表示
  2. ファイル保存機能実装

    • バックエンドでのファイル受信処理
    • 一時ファイルの保存
    • ファイルメタデータのDB保存
    • ファイル命名規則の実装
  3. PDFテキスト抽出実装

    • PDF.jsの導入と設定
    • PDFからのテキスト抽出処理
    • 抽出テキストの前処理
    • エラーハンドリング
  4. DOCXテキスト抽出実装

    • Mammoth.jsの導入と設定
    • DOCXからのテキスト抽出処理
    • 抽出テキストの前処理
    • エラーハンドリング
  5. ファイルプレビュー機能実装

    • アップロードファイルのプレビュー表示
    • PDFのページめくり機能
    • DOCXのプレビュー表示

成果物

  • ファイルアップロードコンポーネント
  • ファイル保存APIエンドポイント
  • PDFテキスト抽出モジュール
  • DOCXテキスト抽出モジュール
  • ファイルプレビュー機能

技術スタック

  • フロントエンド: React Dropzone, PDF.js
  • バックエンド: Multer, PDF.js, Mammoth.js

参照

  • 親チケット: #468
  • 要件定義・設計: #469
  • バックエンド基盤: #470
  • フロントエンド基盤: #471

Redmine Admin さんが8日前に更新

【重要】チケット実行順序について

このチケット(ファイルアップロード・テキスト抽出機能)の子チケットは、以下の順序で実行してください。順序は チケット#512 に定義されているマイルストーン計画に基づいています:

  1. #493: ファイルアップロード機能実装(要件:#510 詳細ファイル処理仕様の完了)
  2. #494: PDFテキスト抽出機能実装
  3. #495: DOCXテキスト抽出機能実装
  4. #496: ファイルプレビュー機能実装

各チケットを開始する前に、必ず前のチケットが完了していることを確認してください。また、このチケットの作業を開始する前に、マイルストーン2(基盤構築)が完了していることを確認してください。

このチケットはマイルストーン3(コア機能実装)の一部です。マイルストーン3の完了条件は以下の通りです:

  • ファイルアップロード・テキスト抽出機能が動作すること
  • AI連携基盤が構築され、プロンプト処理が可能なこと
  • 基本的な文書生成・表示が可能なこと

Redmine Admin さんが8日前に更新

単体テストチケットの追加について

このチケット(ファイルアップロード・テキスト抽出機能)に以下の単体テストチケットを追加しました:

  • #520: ファイル処理機能の単体テスト

実行順序を以下のように更新します:

  1. #493: ファイルアップロード機能実装(要件:#510 詳細ファイル処理仕様の完了)
  2. #494: PDFテキスト抽出機能実装
  3. #495: DOCXテキスト抽出機能実装
  4. #496: ファイルプレビュー機能実装
  5. #520: ファイル処理機能の単体テスト(前の4つのチケットが完了した後に実行)

ファイル処理機能実装の各モジュールが完了した後、すぐに単体テストを実施することで、早期のバグ発見と品質確保が可能になります。

他の形式にエクスポート: Atom PDF