mirror of https://github.com/ZSeven-W/openpencil.git synced 2026-05-31 19:04:29 +07:00

* docs: add image search & generation design spec and implementation plan

- Spec: dual-source image search (Openverse + Wikimedia), multi-provider image generation
- Plan: 16 tasks covering types, server endpoints, settings UI, property panel, auto-search pipeline, MCP integration

* feat(types): add image service types and imagePrompt to ImageNode

* feat(server): add image service API key validation endpoint

Adds POST /api/ai/image-service-test that validates credentials for
openverse (client_credentials), openai/custom (Bearer + /v1/models),
gemini (API key + v1beta/models), and replicate (Bearer + /v1/models).

* feat(server): add multi-provider image generation endpoint

* feat(server): add dual-source image search endpoint (Openverse + Wikimedia)

POST /api/ai/image-search searches freely-licensed images via Openverse
with automatic fallback to Wikimedia Commons on 429 rate-limit responses.
Supports optional OAuth credentials for authenticated Openverse requests.

* feat(store): add imageSearchStatuses to canvas store for runtime status tracking

* feat(store): add image generation config and Openverse OAuth to agent settings

* feat(editor): add Images tab to agent settings dialog

Adds Popover primitive, ImagesPage component with Image Search (Openverse OAuth, test) and Image Generation (provider select, API key, model, base URL) sections, and wires them into the settings dialog sidebar.

* feat(panels): add image search popover with Openverse/Wikimedia results grid

* feat(panels): add image generate popover with multi-provider support

* feat(panels): add Search and Generate buttons to image property section

* feat(ai): update prompts to use imagePrompt instead of src for image nodes

* feat(ai): add auto-search pipeline with Openverse/Wikimedia fallback

* feat(ai): trigger auto image search after design generation completes

* feat(mcp): implement G() operation for image search in batch design DSL

Adds the G(parent, mode, prompt) operation to batch_design DSL that creates
an image node and optionally fetches a real image URL via the image-search
API when mode is "search". Converts executeLine to async to support the
network call.

* feat(mcp): auto-fill images after design refinement in layered pipeline

* feat(ai): split imageSearchQuery and imagePrompt for search vs generation

- ImageNode now has both imageSearchQuery (short keywords for search)
and imagePrompt (long description for AI image generation)
- AI prompts instruct LLM to generate both fields
- Search pipeline and popovers use imageSearchQuery
- Generate popover uses imagePrompt
- Server-side simplifySearchQuery kept as fallback for manual input

* fix(ai): hook auto image search into orchestrator completion path

The primary generation path uses executeOrchestration -> insertStreamingNode,
not applyNodesToCanvas/animateNodesToCanvas. Added scanAndFillImages call
to orchestrator.ts after all sub-agents complete. Added debug logging.
Removed plan/spec docs from git.

* style(editor): remove provider names from image search ready status

* fix(panels): clean up image gen error display and settings UI

- Parse API error response to show concise message instead of raw JSON
- Limit error text to 2 lines with line-clamp
- Fix image gen test button sending wrong service name
- Inline Image Search ready indicator with section header
- Remove debug logging from image search pipeline

* style(panels): allow up to 4 lines for image gen error message

* fix: avoid 1-frame delay when resizing canvas (#60)

rAF callbacks run before ResizeObserver in the same frame.
Scheduling render in ResizeObserver via rAF defers it to the next frame.

Invoke render() synchronously to leverage ResizeObserver's pre-paint timing
and ensure immediate visual update.

* feat(electron): implement desktop application structure and auto-updater

- Introduced a new Electron desktop application with a structured directory for apps and packages.
- Added auto-updater functionality to manage application updates seamlessly.
- Created a comprehensive menu system for the desktop app.
- Implemented logging capabilities for better debugging and error tracking.
- Configured build settings for various platforms (macOS, Windows, Linux) using electron-builder.
- Established TypeScript configurations for both the desktop and web applications.
- Integrated Vite for the web application with support for React and Tailwind CSS.
- Added icons and assets for the desktop application.

* chore: update package versions to 0.5.0 across all package.json files and add pre-commit hook for version synchronization

- Bumped version to 0.5.0 in package.json files for the main project, desktop app, web app, and all packages.
- Introduced a pre-commit hook to automatically sync version numbers from branch names to all package.json files.

* chore: update package versions to 0.5.0 and refactor Skia components

- Bumped version to 0.5.0 in bun.lock and all relevant package.json files.
- Refactored Skia components to utilize shared functionality from @zseven-w/pen-renderer, including image loading, hit testing, and path utilities.
- Removed redundant code and improved modularity by re-exporting necessary functions and classes from the renderer package.

* fix(panels): handle string fill values in icon nodes (#61)

AI-generated icon/path nodes may have fill stored as a raw string
instead of a PenFill[] array, causing "Cannot use 'in' operator"
crash when selecting the node in the property panel.

* chore: update documentation and project structure for monorepo organization

- Added a new version bump command to synchronize all package.json files.
- Updated the project structure to reflect a monorepo setup with organized workspaces for apps and packages.
- Enhanced README files in multiple languages to include the new structure and commands.
- Adjusted image paths in documentation to point to the correct locations for the desktop application.

* feat(ai): incremental image search and improved image generation prompts

- Refactor image search from batch post-generation to incremental queue:
enqueueImageForSearch() triggers as each image node is inserted during
streaming, so images appear progressively instead of all at once after
generation completes. scanAndFillImages() remains as a final sweep.
- Update imagePrompt guidance to avoid "transparent background" and
similar phrases that many models cannot reliably produce.
- Pass node width/height from image panel to generation endpoint for
aspect-ratio-aware output (Gemini aspect ratio mapping, OpenAI size
selection, Replicate dimensions).

* feat(ai): multi-profile image generation config and cleaner error messages

- Support multiple image generation profiles with active selection;
first configured profile becomes default. Old single-config migrated
automatically on hydrate.
- Fix Gemini aspect ratio: move to generationConfig.imageConfig per API spec.
- Extract clean error messages from provider JSON responses (Gemini
error.message, OpenAI error.message, Replicate detail) instead of
returning raw JSON text.
- Remove destructive client-side regex that mangled error display.

* feat(design-md): integrate design system panel and functionality

- Added a new DesignMdPanel component for managing design system specifications.
- Implemented functionality to toggle the design system panel in the editor layout and toolbar.
- Introduced new commands for importing, exporting, and auto-generating design.md content.
- Updated AI chat handlers to utilize design.md data for enhanced design generation.
- Enhanced localization support for design system features across multiple languages.

* perf(canvas): skip draw calls for nodes outside the viewport (#64)

Add viewport culling in render() to avoid issuing CanvasKit draw calls
for off-screen nodes. A 64px screen-space buffer is kept around the
viewport edges so nearby nodes are pre-rendered, preventing pop-in
during fast panning.

* feat(utils): enhance Windows process spawning for CLI scripts

- Updated the buildSpawnClaudeCodeProcess function to handle .cmd and .ps1 scripts appropriately.
- Implemented PowerShell invocation for .ps1 files and ensured safe defaults for .cmd and .exe files.
- Improved handling of command execution to avoid limitations of cmd.exe.

* feat(ai): add support for Gemini CLI integration

- Extended the AI provider options to include 'gemini' across various components and APIs.
- Implemented functions for generating, validating, and connecting to the Gemini CLI.
- Added Gemini-specific error handling and model fetching logic.
- Updated UI components to display Gemini as a selectable provider with appropriate icons and labels.
- Enhanced localization support for Gemini-related features in multiple languages.

* feat(editor): warn before closing with unsaved changes

Intercept window/tab close when isDirty is true:
- Electron: native dialog with Save / Don't Save / Cancel
- Web: beforeunload handler + confirm on New/Open actions
- i18n: close-confirm strings for all 15 locales

* feat(ipc): extract IPC handlers to a dedicated module

- Moved IPC dialog handling and updater functions from main.ts to ipc-handlers.ts for better organization and maintainability.
- Implemented file open/save dialogs, theme setting, and preferences management through IPC.
- Enhanced updater functionality with state management and auto-update settings.
- Improved code structure by separating concerns, making it easier to manage IPC-related logic.

* feat(docs): update CLAUDE documentation and add new files for desktop and web apps

- Enhanced CLAUDE.md with detailed module documentation references for `packages/` and `apps/`.
- Updated `pen-core` description to include clone utilities in `pen-core`.
- Added new documentation files for the desktop and web applications, outlining their structure, components, and functionalities.
- Included IPC handler details in the desktop app documentation for better clarity on file dialogs and theme synchronization.

* feat(docker): add Gemini CLI support and update documentation

- Introduced a new Docker build stage for the Gemini CLI, allowing users to install and run it.
- Updated the Dockerfile to include the installation of the Gemini CLI alongside existing CLI tools.
- Enhanced README files in multiple languages to document the new `openpencil-gemini` image variant.
- Added Gemini CLI connection instructions to the main README for better user guidance.

* feat(docs): add Gemini CLI connection instructions to multiple language READMEs

- Updated README files in German, Spanish, French, Hindi, Indonesian, Japanese, Korean, Portuguese, Russian, Thai, Turkish, Vietnamese, and both Traditional and Simplified Chinese to include connection instructions for the Gemini CLI.
- Enhanced documentation to improve user guidance for connecting the Gemini CLI in agent settings.

* perf(renderer): replace count-based text cache limits with memory-based eviction (#66)

previous limits (PARA_CACHE_MAX=200, TEXT_CACHE_MAX=300) were too small
for scenes with many nodes, causing constant cache churn and paragraph
rebuilds every frame, which dropped FPS significantly during canvas pan.

- switch to byte-budget limits (64 MB paragraphs, 256 MB bitmaps)
- bitmap size measured exactly as cw*ch*4; paragraph WASM heap estimated
as content.length*64+4096
- eviction uses Map insertion order (FIFO) instead of a separate string[]
array, replacing O(n) array.shift() with O(1) Map.entries().next()
- evict before insert so the budget check includes the incoming entry

---------

Co-authored-by: Fini <fini.yang@gmail.com>
Co-authored-by: leinaldo <60176594+leinaldo@users.noreply.github.com>

2026-03-22 09:44:04 +08:00

15 KiB

Raw Blame History

OpenPencil

La primera herramienta de diseño vectorial de código abierto nativa de IA del mundo.
_{Equipos de Agentes Concurrentes • Diseño como Código • Servidor MCP Integrado • Inteligencia Multimodelo}

English · 简体中文 · 繁體中文 · 日本語 · 한국어 · Français · Español · Deutsch · Português · Русский · हिन्दी · Türkçe · ไทย · Tiếng Việt · Bahasa Indonesia

_{Haz clic en la imagen para ver el video de demostración}

Por Qué OpenPencil

🎨 Prompt → Lienzo

Describe cualquier interfaz en lenguaje natural. Obsérvala aparecer en el lienzo infinito en tiempo real con animación de transmisión. Modifica diseños existentes seleccionando elementos y chateando.

🤖 Equipos de Agentes Concurrentes

El orquestador descompone páginas complejas en subtareas espaciales. Múltiples agentes de IA trabajan en diferentes secciones simultáneamente — hero, características, footer — todos transmitiendo en paralelo.

🧠 Inteligencia Multimodelo

Se adapta automáticamente a las capacidades de cada modelo. Claude recibe prompts completos con pensamiento; GPT-4o/Gemini desactivan el pensamiento; modelos más pequeños (MiniMax, Qwen, Llama) reciben prompts simplificados para una salida confiable.

🔌 Servidor MCP

Instalación con un clic en Claude Code, Codex, Gemini, OpenCode, Kiro o Copilot CLIs. Diseña desde tu terminal — lee, crea y modifica archivos .op a través de cualquier agente compatible con MCP.

📦 Diseño como Código

Los archivos .op son JSON — legibles por humanos, compatibles con Git, comparables. Las variables de diseño generan propiedades personalizadas CSS. Exportación de código a React + Tailwind o HTML + CSS.

🖥️ Funciona en Todas Partes

Aplicación web + escritorio nativo en macOS, Windows y Linux mediante Electron. Actualizaciones automáticas desde GitHub Releases. Asociación de archivos .op — doble clic para abrir.

Inicio Rápido

# Instalar dependencias
bun install

# Iniciar el servidor de desarrollo en http://localhost:3000
bun --bun run dev

O ejecutar como aplicación de escritorio:

bun run electron:dev

Requisitos previos: Bun >= 1.0 y Node.js >= 18

Docker

Hay varias variantes de imagen disponibles — elige la que se ajuste a tus necesidades:

Imagen	Tamaño	Incluye
`openpencil:latest`	~226 MB	Solo aplicación web
`openpencil-claude:latest`	—	+ Claude Code CLI
`openpencil-codex:latest`	—	+ Codex CLI
`openpencil-opencode:latest`	—	+ OpenCode CLI
`openpencil-copilot:latest`	—	+ GitHub Copilot CLI
`openpencil-gemini:latest`	—	+ Gemini CLI
`openpencil-full:latest`	~1 GB	Todas las herramientas CLI

Ejecutar (solo web):

docker run -d -p 3000:3000 ghcr.io/zseven-w/openpencil:latest

Ejecutar con AI CLI (ej. Claude Code):

El chat de IA depende del inicio de sesión OAuth de Claude CLI. Usa un volumen Docker para persistir la sesión de inicio de sesión:

# Paso 1 — Iniciar sesión (una sola vez)
docker volume create openpencil-claude-auth
docker run -it --rm \
  -v openpencil-claude-auth:/root/.claude \
  ghcr.io/zseven-w/openpencil-claude:latest claude login

# Paso 2 — Iniciar
docker run -d -p 3000:3000 \
  -v openpencil-claude-auth:/root/.claude \
  ghcr.io/zseven-w/openpencil-claude:latest

Compilar localmente:

# Base (solo web)
docker build --target base -t openpencil .

# Con un CLI específico
docker build --target with-claude -t openpencil-claude .

# Completa (todos los CLIs)
docker build --target full -t openpencil-full .

Diseño Nativo de IA

De Prompt a Interfaz

Texto a diseño — describe una página y se genera en el lienzo en tiempo real con animación de transmisión
Orquestador — descompone páginas complejas en subtareas espaciales para generación en paralelo
Modificación de diseño — selecciona elementos y describe los cambios en lenguaje natural
Entrada visual — adjunta capturas de pantalla o bocetos como referencia para el diseño

Soporte Multiagente

Agente	Configuración
Claude Code	Sin configuración — usa Claude Agent SDK con OAuth local
Codex CLI	Conectar en Configuración de Agente (`Cmd+,`)
OpenCode	Conectar en Configuración de Agente (`Cmd+,`)
GitHub Copilot	`copilot login` y luego conectar en Configuración de Agente (`Cmd+,`)
Gemini CLI	Conectar en Configuración de Agente (`Cmd+,`)

Perfiles de Capacidad de Modelos — adapta automáticamente los prompts, el modo de pensamiento y los tiempos de espera según el nivel del modelo. Los modelos de nivel completo (Claude) reciben prompts completos; los de nivel estándar (GPT-4o, Gemini, DeepSeek) desactivan el pensamiento; los de nivel básico (MiniMax, Qwen, Llama, Mistral) reciben prompts simplificados de JSON anidado para máxima fiabilidad.

Servidor MCP

Servidor MCP integrado — instalación con un clic en Claude Code / Codex / Gemini / OpenCode / Kiro / Copilot CLIs
Detección automática de Node.js — si no está instalado, recurre automáticamente al transporte HTTP e inicia el servidor MCP HTTP
Automatización de diseño desde la terminal: leer, crear y modificar archivos .op a través de cualquier agente compatible con MCP
Flujo de diseño por capas — design_skeleton → design_content → design_refine para diseños multisección de mayor fidelidad
Recuperación segmentada de prompts — carga solo el conocimiento de diseño que necesitas (schema, layout, roles, icons, planning, etc.)
Soporte multipágina — crear, renombrar, reordenar y duplicar páginas mediante herramientas MCP

Generación de Código

React + Tailwind CSS, HTML + CSS, CSS Variables
Vue, Svelte, Flutter, SwiftUI, Jetpack Compose, React Native

Características

Lienzo y Dibujo

Lienzo infinito con panorámica, zoom, guías de alineación inteligentes y ajuste
Rectángulo, Elipse, Línea, Polígono, Pluma (Bezier), Frame, Texto
Operaciones booleanas — unión, resta, intersección con barra de herramientas contextual
Selector de iconos (Iconify) e importación de imágenes (PNG/JPEG/SVG/WebP/GIF)
Diseño automático — vertical/horizontal con gap, padding, justify, align
Documentos multipágina con navegación por pestañas

Sistema de Diseño

Variables de diseño — tokens de color, número y texto con referencias $variable
Soporte multitema — múltiples ejes, cada uno con variantes (Claro/Oscuro, Compacto/Cómodo)
Sistema de componentes — componentes reutilizables con instancias y sobreescrituras
Sincronización CSS — propiedades personalizadas autogeneradas, var(--name) en la salida de código

Importación de Figma

Importa archivos .fig conservando diseño, rellenos, trazos, efectos, texto, imágenes y vectores

Aplicación de Escritorio

Compatible de forma nativa con macOS, Windows y Linux mediante Electron
Asociación de archivos .op — doble clic para abrir, bloqueo de instancia única
Actualización automática desde GitHub Releases
Menú de aplicación nativo y diálogos de archivo

Stack Tecnológico


Frontend	React 19 · TanStack Start · Tailwind CSS v4 · shadcn/ui
Lienzo	CanvasKit/Skia (WASM, acelerado por GPU)
Estado	Zustand v5
Servidor	Nitro
Escritorio	Electron 35
IA	Anthropic SDK · Claude Agent SDK · OpenCode SDK · Copilot SDK
Runtime	Bun · Vite 7
Formato de archivo	`.op` — basado en JSON, legible por humanos, compatible con Git

Estructura del Proyecto

openpencil/
├── apps/
│   ├── web/                 Aplicación web TanStack Start
│   │   ├── src/
│   │   │   ├── canvas/      Motor CanvasKit/Skia — dibujo, sincronización, diseño
│   │   │   ├── components/  Interfaz React — editor, paneles, diálogos compartidos, iconos
│   │   │   ├── services/ai/ Chat de IA, orquestador, generación de diseño, transmisión
│   │   │   ├── stores/      Zustand — lienzo, documento, páginas, historial, IA
│   │   │   ├── mcp/         Herramientas del servidor MCP para integración con CLI externas
│   │   │   ├── hooks/       Atajos de teclado, soltar archivos, pegado de Figma
│   │   │   └── uikit/       Sistema de kit de componentes reutilizables
│   │   └── server/
│   │       ├── api/ai/      API Nitro — chat en streaming, generación, validación
│   │       └── utils/       Wrappers de Claude CLI, OpenCode, Codex, Copilot
│   └── desktop/             Aplicación de escritorio Electron
│       ├── main.ts          Ventana, fork Nitro, menú nativo, actualizador automático
│       ├── ipc-handlers.ts  Diálogos de archivos nativos, sincronización de tema, preferencias IPC
│       └── preload.ts       Puente IPC
├── packages/
│   ├── pen-types/           Definiciones de tipos para el modelo PenDocument
│   ├── pen-core/            Operaciones de árbol del documento, motor de diseño, variables
│   ├── pen-codegen/         Generadores de código (React, HTML, Vue, Flutter, ...)
│   ├── pen-figma/           Parser y conversor de archivos .fig de Figma
│   ├── pen-renderer/        Renderizador independiente CanvasKit/Skia
│   └── pen-sdk/             SDK global (reexporta todos los paquetes)
└── .githooks/               Sincronización de versión pre-commit desde nombre de rama

Atajos de Teclado

Tecla	Acción	Tecla	Acción
`V`	Seleccionar	`Cmd+S`	Guardar
`R`	Rectángulo	`Cmd+Z`	Deshacer
`O`	Elipse	`Cmd+Shift+Z`	Rehacer
`L`	Línea	`Cmd+C/X/V/D`	Copiar/Cortar/Pegar/Duplicar
`T`	Texto	`Cmd+G`	Agrupar
`F`	Frame	`Cmd+Shift+G`	Desagrupar
`P`	Herramienta pluma	`Cmd+Shift+E`	Exportar
`H`	Mano (panorámica)	`Cmd+Shift+C`	Panel de código
`Del`	Eliminar	`Cmd+Shift+V`	Panel de variables
`[ / ]`	Reordenar	`Cmd+J`	Chat de IA
Flechas	Mover 1px	`Cmd+,`	Configuración de agente
`Cmd+Alt+U`	Unión booleana	`Cmd+Alt+S`	Resta booleana
`Cmd+Alt+I`	Intersección booleana

Scripts

bun --bun run dev          # Servidor de desarrollo (puerto 3000)
bun --bun run build        # Compilación de producción
bun --bun run test         # Ejecutar pruebas (Vitest)
npx tsc --noEmit           # Verificación de tipos
bun run bump <version>     # Sincronizar versión en todos los package.json
bun run electron:dev       # Desarrollo con Electron
bun run electron:build     # Empaquetado de Electron

Contribuir

¡Las contribuciones son bienvenidas! Consulta CLAUDE.md para detalles sobre la arquitectura y el estilo de código.

Haz fork y clona el repositorio
Configura la sincronización de versión: git config core.hooksPath .githooks
Crea una rama: git checkout -b feat/my-feature
Ejecuta las verificaciones: npx tsc --noEmit && bun --bun run test
Haz commit con Conventional Commits: feat(canvas): add rotation snapping
Abre un PR contra main

Hoja de Ruta

Variables de diseño y tokens con sincronización CSS
Sistema de componentes (instancias y sobreescrituras)
Generación de diseño con IA y orquestador
Integración con servidor MCP con flujo de diseño por capas
Soporte multipágina
Importación de Figma .fig
Operaciones booleanas (unión, sustracción, intersección)
Perfiles de capacidad multimodelo
Reestructuración en monorepo con paquetes reutilizables
Edición colaborativa
Sistema de plugins

Colaboradores

Comunidad

Únete a nuestro Discord — Haz preguntas, comparte diseños y sugiere funciones.

15 KiB

Raw Blame History

OpenPencil

Por Qué OpenPencil

🎨 Prompt → Lienzo

🤖 Equipos de Agentes Concurrentes

🧠 Inteligencia Multimodelo

🔌 Servidor MCP

📦 Diseño como Código

🖥️ Funciona en Todas Partes

Inicio Rápido

Docker

Diseño Nativo de IA

Características

Stack Tecnológico

Estructura del Proyecto

Atajos de Teclado

Scripts

Contribuir

Hoja de Ruta

Colaboradores

Comunidad

Star History

Licencia

15 KiB Raw Blame History

OpenPencil

Por Qué OpenPencil

🎨 Prompt → Lienzo

🤖 Equipos de Agentes Concurrentes

🧠 Inteligencia Multimodelo

🔌 Servidor MCP

📦 Diseño como Código

🖥️ Funciona en Todas Partes

Inicio Rápido

Docker

Diseño Nativo de IA

Características

Stack Tecnológico

Estructura del Proyecto

Atajos de Teclado

Scripts

Contribuir

Hoja de Ruta

Colaboradores

Comunidad

Star History

Licencia

15 KiB

Raw Blame History