feat: add semantic search with pgvector (closes #68, #69, #70) · 3ec2059470 - stack

feat: add semantic search with pgvector (closes #68, #69, #70)

Some checks failed

ci/woodpecker/push/woodpecker Pipeline failed

Details

ci/woodpecker/pr/woodpecker Pipeline failed

Details

Issues resolved:
- #68: pgvector Setup
  * Added pgvector vector index migration for knowledge_embeddings
  * Vector index uses HNSW algorithm with cosine distance
  * Optimized for 1536-dimension OpenAI embeddings

- #69: Embedding Generation Pipeline
  * Created EmbeddingService with OpenAI integration
  * Automatic embedding generation on entry create/update
  * Batch processing endpoint for existing entries
  * Async generation to avoid blocking API responses
  * Content preparation with title weighting

- #70: Semantic Search API
  * POST /api/knowledge/search/semantic - pure vector search
  * POST /api/knowledge/search/hybrid - RRF combined search
  * POST /api/knowledge/embeddings/batch - batch generation
  * Comprehensive test coverage
  * Full documentation in docs/SEMANTIC_SEARCH.md

Technical details:
- Uses OpenAI text-embedding-3-small model (1536 dims)
- HNSW index for O(log n) similarity search
- Reciprocal Rank Fusion for hybrid search
- Graceful degradation when OpenAI not configured
- Async embedding generation for performance

Configuration:
- Added OPENAI_API_KEY to .env.example
- Optional feature - disabled if API key not set
- Falls back to keyword search in hybrid mode

This commit is contained in:

Jason Woltje

2026-01-30 00:24:41 -06:00

parent 22cd68811d

commit 3ec2059470

14 changed files with 1408 additions and 5 deletions

									
										1

apps/api/package.json
									
												View File
												
				@@ -48,6 +48,7 @@

				    "marked-gfm-heading-id": "^4.1.3",

				    "marked-highlight": "^2.2.3",

				    "ollama": "^0.6.3",

				    "openai": "^6.17.0",

				    "reflect-metadata": "^0.2.2",

				    "rxjs": "^7.8.1",

				    "sanitize-html": "^2.17.0",

feat: add semantic search with pgvector (closes #68, #69, #70) Some checks failed ci/woodpecker/push/woodpecker Pipeline failed Details ci/woodpecker/pr/woodpecker Pipeline failed Details

1 apps/api/package.json Unescape Escape View File

feat: add semantic search with pgvector (closes #68, #69, #70)

Some checks failed

ci/woodpecker/push/woodpecker Pipeline failed

Details

ci/woodpecker/pr/woodpecker Pipeline failed

Details

1

apps/api/package.json

View File