Wegent Evaluate

RAG (Retrieval-Augmented Generation) Evaluation Service for automatic quality assessment and analysis.

Features

Data Synchronization: Automatically fetch historical conversation data from external APIs
RAGAS Evaluation: Evaluate RAG responses using Faithfulness, Answer Relevancy, and Context Precision metrics
LLM Analysis: Deep analysis and improvement suggestions using large language models
Analytics Dashboard: Visualize trends, compare retrievers/embeddings, and analyze issues
Scheduled Tasks: Automated daily sync and evaluation tasks

Tech Stack

Backend

FastAPI + SQLAlchemy + MySQL
APScheduler for scheduled tasks
RAGAS >= 0.2.0 for evaluation
LangChain for LLM integration

Frontend

Next.js 15 + React 19 + TypeScript
shadcn/ui + Tailwind CSS
Recharts for data visualization

Quick Start

d

Using Docker Compose

Copy environment file:

cp .env.example .env
# Edit .env with your configuration

Start all services:

docker-compose up -d

Access the application:

Frontend: http://localhost:3000
Backend API: http://localhost:8000

Manual Setup

Backend

cd backend
# Install dependencies
pip install uv
uv pip install -e .

# Run database migrations
uv run alembic upgrade head

# Start the server
uv run uvicorn main:app --reload

Frontend

cd frontend
npm install
npm run dev

Configuration

See .env.example for all available configuration options:

Database: MySQL connection settings
External API: OAuth 2.0 credentials for data sync
RAGAS: LLM and embedding model configuration
Scheduled Tasks: Cron expressions for automation

API Endpoints

Sync

POST /api/sync/trigger - Trigger data synchronization
GET /api/sync/status/{sync_id} - Get sync job status
GET /api/sync/history - Get sync history

Evaluation

POST /api/evaluation/trigger - Trigger evaluation job
GET /api/evaluation/status/{job_id} - Get evaluation status
GET /api/evaluation/results - List evaluation results
GET /api/evaluation/results/{id} - Get evaluation detail
GET /api/evaluation/summary - Get evaluation summary

Analytics

GET /api/analytics/trends - Get score trends
GET /api/analytics/comparison/retriever - Compare retrievers
GET /api/analytics/comparison/embedding - Compare embeddings
GET /api/analytics/comparison/context/{id} - Compare by context
GET /api/analytics/issues - Get issue analytics

Metrics

RAGAS Evaluation Metrics

Faithfulness (0-1): Measures how faithful the answer is to the retrieved context
Answer Relevancy (0-1): Measures how relevant the answer is to the question
Context Precision (0-1): Measures the quality of retrieved context

Issue Types

retrieval_miss: Retrieved content doesn't match the query
retrieval_irrelevant: Retrieved content is irrelevant
answer_hallucination: Answer contains information not in context
answer_incomplete: Answer doesn't fully utilize context
answer_irrelevant: Answer doesn't address the question
knowledge_gap: Knowledge base lacks relevant content

License

Apache-2.0

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
backend		backend
docker		docker
frontend		frontend
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
docker-compose.yml		docker-compose.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Wegent Evaluate

Features

Tech Stack

Backend

Frontend

Quick Start

Using Docker Compose

Manual Setup

Backend

Frontend

Configuration

API Endpoints

Sync

Evaluation

Analytics

Metrics

RAGAS Evaluation Metrics

Issue Types

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Wegent Evaluate

Features

Tech Stack

Backend

Frontend

Quick Start

Using Docker Compose

Manual Setup

Backend

Frontend

Configuration

API Endpoints

Sync

Evaluation

Analytics

Metrics

RAGAS Evaluation Metrics

Issue Types

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages