papayu/CHANGELOG.md
Yuriy 764003fc09 Commit X4: Auto inject Online Research summary into plan context
This commit implements fully automatic injection of online research results into the LLM prompt without user clicks.

## Backend

### Environment Variables
- Added `PAPAYU_ONLINE_AUTO_USE_AS_CONTEXT=1` (default: 0) to enable automatic injection of online research results into subsequent `proposeActions` calls.
- Added `is_online_auto_use_as_context()` helper function in `online_research/mod.rs`.

### Command Changes
- **`propose_actions` command**: Added `online_fallback_reason: Option<String>` parameter to track the error code that triggered online fallback.
- **`llm_planner::plan` function**: Added `online_fallback_reason: Option<&str>` parameter for tracing.
- **Trace Enhancements**: Added `online_fallback_reason` field to trace when `online_fallback_executed` is true.

### Module Exports
- Made `extract_error_code_prefix` public in `online_research/fallback.rs` for frontend use.

## Frontend

### Project Settings
- Added `onlineAutoUseAsContext` state (persisted in `localStorage` as `papa_yu_online_auto_use_as_context`).
- Initialized from localStorage or defaults to `false`.
- Auto-saved to localStorage on change.

### Auto-Chain Flow
- When `plan.ok === false` and `plan.online_fallback_suggested` is present:
  - If `onlineAutoUseAsContext === true` and not already attempted for this goal (cycle protection via `lastGoalWithOnlineFallbackRef`):
    - Automatically calls `researchAnswer(query)`.
    - Truncates result to `8000` chars and `10` sources (frontend-side limits).
    - Immediately calls `proposeActions` again with:
      - `online_context_md`
      - `online_context_sources`
      - `online_fallback_executed: true`
      - `online_fallback_reason: error_code`
      - `online_fallback_attempted: true`
    - Displays the new plan/error without requiring "Use as context" button click.
  - If `onlineAutoUseAsContext === false` or already attempted:
    - Falls back to manual mode (shows online research block with "Use as context (once)" button).

### Cycle Protection
- `lastGoalWithOnlineFallbackRef` tracks the last goal that triggered online fallback.
- If the same goal triggers fallback again, auto-chain is skipped to prevent infinite loops.
- Maximum 1 auto-chain per user query.

### UI Enhancements
- **Online Research Block**:
  - When `onlineAutoUseAsContext === true`: displays "Auto-used ✓" badge.
  - Hides "Use as context (once)" button when auto-use is enabled.
  - Adds "Disable auto-use" button (red) to disable auto-use for the current project.
  - When disabled, shows system message: "Auto-use отключён для текущего проекта."

### API Updates
- **`proposeActions` in `tauri.ts`**: Added `onlineFallbackReason?: string | null` parameter.

## Tests

- **`online_context_auto_test.rs`**: Added unit tests for:
  - `test_is_online_auto_use_disabled_by_default`
  - `test_is_online_auto_use_enabled_when_set`
  - `test_extract_error_code_prefix_timeout`
  - `test_extract_error_code_prefix_schema`
  - `test_extract_error_code_prefix_empty_when_no_prefix`

All tests pass.

## Documentation

### README.md
- Added "Auto-use (X4)" subsection under "Online Research":
  - Describes `PAPAYU_ONLINE_AUTO_USE_AS_CONTEXT=1` env var (default: 0).
  - Explains cycle protection: maximum 1 auto-chain per goal.
  - Documents UI behavior: "Auto-used ✓" badge and "Disable auto-use" button.

## Behavior Summary

**Without auto-use (default):**
1. `proposeActions` → error + `online_fallback_suggested`
2. UI calls `researchAnswer`
3. UI displays online research block with "Use as context (once)" button
4. User clicks button → sets `onlineContextPending` → next `proposeActions` includes context

**With auto-use enabled (`PAPAYU_ONLINE_AUTO_USE_AS_CONTEXT=1`):**
1. `proposeActions` → error + `online_fallback_suggested`
2. UI calls `researchAnswer` automatically
3. UI displays online research block with "Auto-used ✓" badge
4. UI immediately calls `proposeActions` again with online context → displays new plan
5. If still fails → no retry (cycle protection)

## Build Status

-  Backend: `cargo build --lib` (2 warnings about unused code for future features)
-  Frontend: `npm run build`
-  Tests: `cargo test online_context_auto_test --lib` (5 passed)

Co-authored-by: Cursor <cursoragent@cursor.com>
2026-01-31 14:39:40 +03:00

9.7 KiB
Raw Blame History

Changelog

Все значимые изменения в проекте PAPA YU фиксируются в этом файле.

Формат основан на Keep a Changelog.


[2.4.4] — 2025-01-31

Protocol stability (v1)

  • Schema version: LLM_PLAN_SCHEMA_VERSION=1, x_schema_version в схеме, schema_hash (sha256) в trace.
  • Версионирование: при изменении контракта ответа LLM — увеличивать schema_version; trace содержит schema_version и schema_hash для воспроизводимости.
  • Рекомендуемый тег: v1.0.0 или v0.x — зафиксировать «стабильный релиз» перед введением v2.

Добавлено

  • UX: история сессий по проекту — блок «История сессий» с раскрывающимся списком сессий (дата, количество событий, последнее сообщение); обновление списка после agentic run.
  • UX: в блоке профиля отображаются лимиты (max_actions_per_tx, timeout_sec).
  • UX: фильтр расширений в диалоге «Прикрепить файл» (исходники и конфиги: .ts, .tsx, .js, .jsx, .rs, .py, .json, .toml, .md, .yml, .yaml, .css, .html, .xml).
  • UX: горячие клавиши — Ctrl+Enter (Cmd+Enter): отправить/запустить анализ; Escape: сбросить превью изменений.
  • UX: тёмная тема — переключатель в боковой панели, CSS-переменные для обоих режимов, сохранение выбора в localStorage, поддержка системных настроек.
  • UX: экспорт/импорт настроек — кнопки в боковой панели для сохранения и восстановления всех настроек (проекты, профили, сессии, папки) в JSON-файл.
  • Тестирование: юнит-тесты в Rust для detect_project_type, get_project_limits, is_protected_file, is_text_allowed, settings_export (18 тестов).
  • Тестирование: тестовые фикстуры в tests/fixtures/ — минимальные проекты для E2E тестирования (minimal-node, minimal-rust).
  • Документация: E2E сценарий в docs/E2E_SCENARIO.md; обновлён README до v2.4.4; README для тестов в tests/README.md.
  • Контекст прикреплённых файлов: в отчёт и batch передаётся список прикреплённых файлов (attached_files в BatchPayload и AnalyzeReport); фронт передаёт его при вызове runBatchCmd.
  • LLM-планировщик: при заданном PAPAYU_LLM_API_URL команда «Предложить исправления» вызывает OpenAI-совместимый API (OpenAI, Ollama и др.); ответ парсится в план действий (CREATE_FILE, CREATE_DIR и т.д.). Без настройки — эвристический план по отчёту.
  • Бэкенд: команды export_settings и import_settings для резервного копирования и переноса настроек между машинами.
  • Конфиг: расширенный allowlist команд verify (verify_allowlist.json) — добавлены cargo clippy, tsc --noEmit, mypy, pytest --collect-only.
  • Инфраструктура: инициализирован Git-репозиторий с улучшенным .gitignore.
  • Preview diff в propose flow: после получения плана автоматически вызывается preview_actions, diffs отображаются в UI.
  • ERR_UPDATE_WITHOUT_BASE: в режиме APPLY UPDATE_FILE разрешён только для файлов, прочитанных в Plan (FILE[path] или === path ===).
  • Protected paths: denylist для .env, *.pem, *.key, *.p12, id_rsa*, **/secrets/**.
  • Content validation: запрет NUL, >10% non-printable = ERR_PSEUDO_BINARY; лимиты max_path_len=240, max_actions=200, max_total_content_bytes=5MB.
  • EOL: PAPAYU_NORMALIZE_EOL=lf — нормализация \r\n→\n и trailing newline.
  • Наблюдаемость: trace_id (UUID) на каждый propose; лог-ивенты LLM_REQUEST_SENT, LLM_RESPONSE_OK, VALIDATION_FAILED, APPLY_SUCCESS, APPLY_ROLLBACK, PREVIEW_READY.
  • Трассировка: PAPAYU_TRACE=1 — запись в .papa-yu/traces/<trace_id>.json.
  • Детерминизм LLM: temperature=0, max_tokens=65536, top_p=1, presence_penalty=0, frequency_penalty=0 (PAPAYU_LLM_TEMPERATURE, PAPAYU_LLM_MAX_TOKENS).
  • Capability detection: при ошибке API response_format — автоматический retry без response_format (Ollama и др.).
  • Schema version: x_schema_version в llm_response_schema.json; schema_hash (sha256) в trace; LLM_PLAN_SCHEMA_VERSION в prompt.
  • Кеш контекста: read_file/search/logs/env кешируются в plan-цикле; CONTEXT_CACHE_HIT/MISS.
  • Контекст-диета: PAPAYU_CONTEXT_MAX_FILES=8, MAX_FILE_CHARS=20k, MAX_TOTAL_CHARS=120k; head+tail truncation; MIN_CHARS_FOR_PRIORITY0=4k; CONTEXT_DIET_APPLIED.
  • Trace: context_stats (files_count, dropped, total_chars, logs_chars, truncated) и cache_stats (hits/misses по env/logs/read/search, hit_rate).
  • Кеш logs: ключ Logs включает last_n — разные last_n не пересекаются.
  • Golden traces: эталонные fixtures в docs/golden_traces/v1/ — формат protocol/request/context/result (без raw_content). Тест golden_traces_v1_validate валидирует schema_version, schema_hash, JSON schema, validate_actions, NO_CHANGES при apply+empty. Конвертер trace_to_golden (cargo run --bin trace_to_golden).
  • Compatibility matrix: в PROTOCOL_V1.md — Provider Compatibility таблица и 5 поведенческих гарантий.
  • PROTOCOL_V2_PLAN.md: план v2 (PATCH_FILE, REPLACE_RANGE, base_sha256).
  • make/npm shortcuts: make golden (trace→fixture), make test-protocol (golden_traces_v1_validate).
  • CI: .github/workflows/protocol-check.yml — golden_traces_v1_validate на push/PR.
  • Политика golden traces: в docs/golden_traces/README.md — когда/как обновлять, при смене schema_hash.
  • Protocol v2 schema (plumbing): llm_response_schema_v2.json — object-only, PATCH_FILE, base_sha256. PAPAYU_PROTOCOL_VERSION=1|2 (default 1). schema_version и schema_hash динамические в trace.
  • V2 system prompt: FIX_PLAN_SYSTEM_PROMPT_V2 при protocol=2 и fix-plan/fixit.
  • Контекст v2: FILE-блоки с sha256: FILE[path] (sha256=...): для base_sha256 в PATCH_FILE.
  • PATCH_FILE engine: diffy, sha256_hex, looks_like_unified_diff, apply_unified_diff. ActionKind::PatchFile, apply_patch_file_tx, preview. ERR_PATCH_NOT_UNIFIED, ERR_BASE_MISMATCH, ERR_PATCH_APPLY_FAILED.
  • Коммит 5: v2 prompt UPDATE_FILE запрещён для существующих. ERR_V2_UPDATE_EXISTING_FORBIDDEN (plan + apply). bytes_before/bytes_after в DiffItem. ERR_NON_UTF8_FILE docs.
  • Golden traces v2: docs/golden_traces/v2/ (5 fixtures), golden_traces_v2_validate. CI: v1 + v2.

Изменено

  • Лимиты профиля применяются в apply_actions_tx и run_batch — при превышении max_actions_per_tx возвращается ошибка TOO_MANY_ACTIONS.
  • Таймаут проверок в verify и auto_check задаётся из профиля (timeout_sec); в verify_project добавлен таймаут на выполнение каждой проверки (spawn + try_wait + kill при превышении).
  • Синхронизированы версии в package.json, Cargo.toml и tauri.conf.json.

[2.4.3] — ранее

Реализовано

  • Профиль по пути (тип проекта, лимиты, goal_template).
  • Agentic run — цикл анализ → план → превью → применение → проверка → откат при ошибке.
  • Прикрепление файлов, кнопка «Прикрепить файл».
  • Guard опасных изменений (is_protected_file, is_text_allowed).
  • Подтверждение Apply (user_confirmed).
  • Единый API-слой (src/lib/tauri.ts), типы в src/lib/types.ts.
  • Компоненты PathSelector, AgenticResult, хук useUndoRedo.
  • Транзакционное apply с snapshot и откатом при падении auto_check.
  • Undo/Redo по последней транзакции.
  • Единый batch endpoint (run_batch): analyze → preview → apply (при confirmApply) → autoCheck.

[2.3.2] — ранее

  • Apply + Real Undo (snapshot в userData/history, откат при падении check).
  • AutoCheck для Node, Rust, Python.
  • Actions: README, .gitignore, tests/, .env.example.
  • UX: двухфазное применение, кнопки «Показать исправления», «Применить», «Отмена», «Откатить последнее».
  • Folder Links (localStorage + userData/folder_links.json).
  • Брендинг PAPA YU, минимальный размер окна 1024×720.