Output Database Schema

Database Schema¶

The framework creates a DuckDB database with the following schema structure:

entity: Contains standardized entity information
- name: Unique entity names with IDs
- address: Unique addresses with IDs
- street: Unique street information with IDs
- street_name: Unique street names with IDs
- name_similarity: TF-IDF similarity scores between entity names
- street_name_similarity: TF-IDF similarity scores between entity addresses
link: Contains match information between entities
- {entity1}_{entity2}: Links between entities with match scores
User-defined schemas: Contains the original data with cleaned fields
- Tables as defined in your configuration