Unified Faceting System

Overview

OpenRegister implements a unified two-stage faceting system that leverages SOLR's native faceting capabilities while providing a simplified interface. The system uses schema properties marked with facetable: true which are automatically converted to SOLR fields with docValues: true for efficient faceting.

Key Benefits

SOLR Native Performance: Uses SOLR's built-in JSON faceting for maximum efficiency
Schema-Driven: Based on explicit facetable: true properties in schemas
Two-Stage UX: Clear separation between discovery and data loading
Translation Layer: Converts SOLR responses to OpenRegister's unified format
Backward Compatible: Works with existing faceting interfaces

Two-Stage Architecture

Stage 1: Facet Discovery (`_facets=true`)

Discovers available facetable fields and their characteristics without computing actual counts.

GET /api/objects/{register}/{schema}?_facets=true&_limit=0

Response Structure:

{
  "results": [],
  "total": 0,
  "facets": {
    "available": {
      "@self": {
        "register": {
          "type": "categorical",
          "facet_types": ["terms"],
          "description": "Register that contains the object"
        },
        "created": {
          "type": "date",
          "facet_types": ["date_histogram", "range"],
          "description": "Creation timestamp"
        }
      },
      "object_fields": {
        "status": {
          "type": "string",
          "facet_types": ["terms"],
          "title": "Status",
          "source": "schema"
        },
        "priority": {
          "type": "integer", 
          "facet_types": ["range", "terms"],
          "title": "Priority Level",
          "source": "schema"
        }
      }
    }
  }
}

Stage 2: Facet Data (`_facets[field][type]=...`)

Retrieves actual facet counts and buckets for specified fields.

GET /api/objects/{register}/{schema}?_facets[@self][register][type]=terms&_facets[status][type]=terms

Response Structure:

{
  "results": [...],
  "total": 150,
  "facets": {
    "data": {
      "@self": {
        "register": {
          "type": "terms",
          "buckets": [
            {"key": "1", "label": "Publications", "count": 120},
            {"key": "2", "label": "Events", "count": 30}
          ]
        }
      },
      "status": {
        "type": "terms",
        "buckets": [
          {"key": "active", "count": 100},
          {"key": "draft", "count": 35},
          {"key": "archived", "count": 15}
        ]
      }
    }
  }
}

Optional: Combined Mode (`_facets=include`)

For performance-optimized scenarios, get both discovery and data in one call.

GET /api/objects/{register}/{schema}?_facets=include

Implementation Strategy

SOLR-Native Translation

The system works by:

Schema Analysis: Reads facetable: true properties from schemas
SOLR Field Mapping: Uses existing SOLR fields with docValues: true
JSON Faceting: Leverages SOLR's native json.facet parameter
Response Translation: Converts SOLR format to OpenRegister format

Data Source Priority

SOLR (primary) - Native JSON faceting with high performance
Database (fallback) - SQL-based aggregation for compatibility

Field Discovery Method

Schema-based only - Uses fields marked with facetable: true
No object analysis - Relies on schema definitions for consistency

Terms: Categorical data (status, category, etc.)
Date Histogram: Time-based data with intervals
Range: Numeric data with custom buckets

Frontend Integration

SearchSideBar Implementation

// Stage 1: Discover available facets
const discovery = await objectStore.getFacetableFields()

// Stage 2: Enable specific facets
await objectStore.enableFacets(['@self.register', 'status', 'priority'])

// Optional: Get everything at once
await objectStore.getFacetsIncluded()

User Experience Flow

User selects register/schema
System discovers available facets (Stage 1)
User enables desired facets via checkboxes
System loads facet data (Stage 2)
User applies facet filters to search results

Performance Considerations

Discovery Stage (`_facets=true`)

SOLR: Schema property analysis (~2ms)
Database: Schema property analysis (~2ms)

Data Stage (`_facets[field]=...`)

SOLR: Native JSON faceting (~5-10ms per facet)
Database: SQL GROUP BY queries (~15-25ms per facet)

Combined Mode (`_facets=include`)

SOLR: Single request with JSON faceting (~15ms)
Database: Parallel queries (~35ms)

SOLR Advantages

Native docValues: Fields created with faceting optimizations
JSON Faceting: Modern, efficient aggregation API
No Sampling: Uses actual indexed data, not samples
Concurrent Processing: Multiple facets processed in parallel

Migration Path

From Current Systems

Schema-based: Continue using facetable: true (preferred)
Automatic: Fallback for schemas without facetable properties
Legacy: Maintain backward compatibility

API Compatibility

Existing _facetable=true parameter maps to new _facets=true
Existing facet configuration syntax remains supported
New simplified syntax available for common use cases

Configuration

Schema Properties

{
  "properties": {
    "status": {
      "type": "string",
      "title": "Status",
      "facetable": true,
      "facet_config": {
        "type": "terms",
        "sort": "count"
      }
    }
  }
}

System Settings

// In app config
'faceting' => [
    'default_source' => 'solr', // 'solr' or 'database'
    'discovery_sample_size' => 100,
    'max_facet_values' => 50,
    'enable_combined_mode' => true
]

Unified Faceting System

Overview

Key Benefits

Two-Stage Architecture

Stage 1: Facet Discovery (`_facets=true`)

Stage 2: Facet Data (`_facets[field][type]=...`)

Optional: Combined Mode (`_facets=include`)

Implementation Strategy

SOLR-Native Translation

Data Source Priority

Field Discovery Method

Facet Types Supported

Frontend Integration

SearchSideBar Implementation

User Experience Flow

Performance Considerations

Discovery Stage (`_facets=true`)

Data Stage (`_facets[field]=...`)

Combined Mode (`_facets=include`)

SOLR Advantages

Migration Path

From Current Systems

API Compatibility

Configuration

Schema Properties

System Settings

Error Handling

Graceful Degradation

User Feedback

Future Enhancements

Planned Features

Performance Optimizations

Overview​

Key Benefits​

Two-Stage Architecture​

Stage 1: Facet Discovery (_facets=true)​

Stage 2: Facet Data (_facets[field][type]=...)​

Optional: Combined Mode (_facets=include)​

Implementation Strategy​

SOLR-Native Translation​

Data Source Priority​

Field Discovery Method​

Facet Types Supported​

Frontend Integration​

SearchSideBar Implementation​

User Experience Flow​

Performance Considerations​

Discovery Stage (_facets=true)​

Data Stage (_facets[field]=...)​

Combined Mode (_facets=include)​

SOLR Advantages​

Migration Path​

From Current Systems​

API Compatibility​

Configuration​

Schema Properties​

System Settings​

Error Handling​

Graceful Degradation​

User Feedback​

Future Enhancements​

Planned Features​

Performance Optimizations​

Overview

Key Benefits

Two-Stage Architecture

Stage 1: Facet Discovery (`_facets=true`)

Stage 2: Facet Data (`_facets[field][type]=...`)

Optional: Combined Mode (`_facets=include`)

Implementation Strategy

SOLR-Native Translation

Data Source Priority

Field Discovery Method

Facet Types Supported

Frontend Integration

SearchSideBar Implementation

User Experience Flow

Performance Considerations

Discovery Stage (`_facets=true`)

Data Stage (`_facets[field]=...`)

Combined Mode (`_facets=include`)

SOLR Advantages

Migration Path

From Current Systems

API Compatibility

Configuration

Schema Properties

System Settings

Error Handling

Graceful Degradation

User Feedback

Future Enhancements

Planned Features

Performance Optimizations