WIP: add kanjivg data

migrations: add version tables for all data sources
util/romaji_transliteration: add functions to generate transliteration spans
2026-03-03 13:47:59 +09:00 · 2026-03-03 12:59:58 +09:00 · 2026-03-02 18:23:36 +09:00 · 2026-03-02 17:37:45 +09:00 · 2026-03-02 17:16:14 +09:00 · 2026-03-02 15:02:36 +09:00
58 changed files with 2333 additions and 1289 deletions
--- a/.gitea/workflows/build-and-test.yml
+++ b/.gitea/workflows/build-and-test.yml
@@ -0,0 +1,71 @@
+name: "Build and test"
+on:
+  workflow_dispatch:
+  pull_request:
+  push:
+jobs:
+  evals:
+    runs-on: debian-latest
+    steps:
+    - uses: actions/checkout@v6
+
+    - name: Install sudo
+      run: apt-get update && apt-get -y install sudo
+
+    - name: Install nix
+      uses: https://github.com/cachix/install-nix-action@v31
+      with:
+        extra_nix_config: |
+          experimental-features = nix-command flakes
+          show-trace = true
+          max-jobs = auto
+          trusted-users = root
+          experimental-features = nix-command flakes
+          build-users-group =
+
+    - name: Update database inputs
+      run: |
+        nix flake update jmdict-src
+        nix flake update jmdict-with-examples-src
+        nix flake update radkfile-src
+        nix flake update kanjidic2-src
+
+    - name: Build database
+      run: nix build .#database -L
+
+    - name: Upload database as artifact
+      uses: actions/upload-artifact@v3
+      with:
+        name: jadb-${{ gitea.sha }}.zip
+        path: result/jadb.sqlite
+        if-no-files-found: error
+        retention-days: 15
+        # Already compressed
+        compression: 0
+
+    - name: Print database statistics
+      run: nix develop .# --command sqlite3_analyzer result/jadb.sqlite
+
+    # TODO: Defer failure of tests until after the coverage report is generated and uploaded.
+    - name: Run tests
+      run: nix develop .# --command dart run test --concurrency=1 --coverage-path=coverage/lcov.info
+
+    - name: Generate coverage report
+      run: |
+          GENHTML_ARGS=(
+            --current-date="$(date)"
+            --dark-mode
+            --output-directory coverage/report
+          )
+
+          nix develop .# --command genhtml "${GENHTML_ARGS[@]}" coverage/lcov.info
+
+    - name: Upload coverage report
+      uses: https://git.pvv.ntnu.no/Projects/rsync-action@v2
+      with:
+        source: ./coverage
+        target: jadb/${{ gitea.ref_name }}/
+        username: oysteikt
+        ssh-key: ${{ secrets.OYSTEIKT_GITEA_WEBDOCS_SSH_KEY }}
+        host: microbel.pvv.ntnu.no
+        known-hosts: "microbel.pvv.ntnu.no ecdsa-sha2-nistp256 AAAAE2VjZHNhLXNoYTItbmlzdHAyNTYAAAAIbmlzdHAyNTYAAABBBEq0yasKP0mH6PI6ypmuzPzMnbHELo9k+YB5yW534aKudKZS65YsHJKQ9vapOtmegrn5MQbCCgrshf+/XwZcjbM="
--- a/.gitea/workflows/build.yml
+++ b/.gitea/workflows/build.yml
@@ -1,38 +0,0 @@
-name: "Build database"
-on:
-  pull_request:
-  push:
-jobs:
-  evals:
-    runs-on: debian-latest
-    steps:
-    - uses: actions/checkout@v6
-
-    - name: Install sudo
-      run: apt-get update && apt-get -y install sudo
-
-    - name: Install nix
-      uses: https://github.com/cachix/install-nix-action@v31
-
-    - name: Configure nix
-      run: echo -e "show-trace = true\nmax-jobs = auto\ntrusted-users = root\nexperimental-features = nix-command flakes\nbuild-users-group =" > /etc/nix/nix.conf
-
-    - name: Update database inputs
-      run: |
-        nix flake update jmdict-src
-        nix flake update jmdict-with-examples-src
-        nix flake update radkfile-src
-        nix flake update kanjidic2-src
-
-    - name: Build database
-      run: nix build .#database -L
-
-    - name: Upload database as artifact
-      uses: actions/upload-artifact@v3
-      with:
-        name: jadb-${{ gitea.sha }}.zip
-        path: result/jadb.sqlite
-        if-no-files-found: error
-        retention-days: 15
-        # Already compressed
-        compression: 0
--- a/.gitea/workflows/test.yml
+++ b/.gitea/workflows/test.yml
@@ -1,31 +0,0 @@
-name: "Run tests"
-on:
-  pull_request:
-  push:
-jobs:
-  evals:
-    runs-on: debian-latest
-    steps:
-    - uses: actions/checkout@v6
-
-    - name: Install sudo
-      run: apt-get update && apt-get -y install sudo
-
-    - name: Install nix
-      uses: https://github.com/cachix/install-nix-action@v31
-
-    - name: Configure nix
-      run: echo -e "show-trace = true\nmax-jobs = auto\ntrusted-users = root\nexperimental-features = nix-command flakes\nbuild-users-group =" > /etc/nix/nix.conf
-
-    - name: Update database inputs
-      run: |
-        nix flake update jmdict-src
-        nix flake update jmdict-with-examples-src
-        nix flake update radkfile-src
-        nix flake update kanjidic2-src
-
-    - name: Build database
-      run: nix build .#database -L
-
-    - name: Run tests
-      run: nix develop .# --command dart test
--- a/.gitignore
+++ b/.gitignore
@@ -8,6 +8,7 @@
 # Conventional directory for build output.
 /doc/
 /build/
+/coverage/
 main.db

 # Nix
--- a/README.md
+++ b/README.md
@@ -1,7 +1,9 @@
-# jadb
-
 [![built with nix](https://builtwithnix.org/badge.svg)](https://builtwithnix.org)

+[Latest coverage report](https://www.pvv.ntnu.no/~oysteikt/gitea/jadb/main/coverage/report/)
+
+# jadb
+
 An SQLite database containing open source japanese dictionary data combined from several sources

 Note that while the license for the code is MIT, the data has various licenses.
@@ -16,3 +18,26 @@ Note that while the license for the code is MIT, the data has various licenses.
 | **Tanos JLPT levels:** | https://www.tanos.co.uk/jlpt/ |
 | **Kangxi Radicals:**   | https://ctext.org/kangxi-zidian |

+## Implementation details
+
+### Word search
+
+The word search procedure is currently split into 3 parts:
+
+1. **Entry ID query**:
+
+Use a complex query with various scoring factors to try to get list of
+database ids pointing at dictionary entries, sorted by how likely we think this
+word is the word that the caller is looking for. The output here is a `List<int>`
+
+2. **Data Query**:
+
+Takes the entry id list from the last search, and performs all queries needed to retrieve
+all the dictionary data for those IDs. The result is a struct with a bunch of flattened lists
+with data for all the dictionary entries. These lists are sorted by the order that the ids
+were provided.
+
+3. **Regrouping**:
+
+Takes the flattened data, and regroups the items into structs with a more "hierarchical" structure.
+All data tagged with the same ID will end up in the same struct. Returns a list of these structs.
--- a/flake.lock
+++ b/flake.lock
@@ -3,7 +3,7 @@
    "jmdict-src": {
      "flake": false,
      "locked": {
-        "narHash": "sha256-1if5Z1ynrCd05ySrvD6ZA1PfKBayhBFzUOe5vplwYXM=",
+        "narHash": "sha256-lh46uougUzBrRhhwa7cOb32j5Jt9/RjBUhlVjwVzsII=",
        "type": "file",
        "url": "http://ftp.edrdg.org/pub/Nihongo/JMdict_e.gz"
      },
@@ -15,7 +15,7 @@
    "jmdict-with-examples-src": {
      "flake": false,
      "locked": {
-        "narHash": "sha256-3Eb8iVSZFvuf4yH/53tDdN6Znt+tvvra6kd7GIv4LYE=",
+        "narHash": "sha256-5oS2xDyetbuSM6ax3LUjYA3N60x+D3Hg41HEXGFMqLQ=",
        "type": "file",
        "url": "http://ftp.edrdg.org/pub/Nihongo/JMdict_e_examp.gz"
      },
@@ -27,7 +27,7 @@
    "kanjidic2-src": {
      "flake": false,
      "locked": {
-        "narHash": "sha256-mg2cP3rX1wm+dTAQCNHthVcKUH5PZRhGbHv1AP2EwJQ=",
+        "narHash": "sha256-orSeQqSxhn9TtX3anYtbiMEm7nFkuomGnIKoVIUR2CM=",
        "type": "file",
        "url": "https://www.edrdg.org/kanjidic/kanjidic2.xml.gz"
      },
@@ -36,13 +36,29 @@
        "url": "https://www.edrdg.org/kanjidic/kanjidic2.xml.gz"
      }
    },
+    "kanjivg-src": {
+      "flake": false,
+      "locked": {
+        "lastModified": 1772352482,
+        "narHash": "sha256-8EG3Y1daI2B24NELQwU+eXl/7OmWnW/RXMAQSRVLzWw=",
+        "ref": "refs/heads/master",
+        "rev": "0b4309cf6d74799b0e4b72940d8267fbe73f72d0",
+        "revCount": 2212,
+        "type": "git",
+        "url": "https://git.pvv.ntnu.no/mugiten/kanjivg.git"
+      },
+      "original": {
+        "type": "git",
+        "url": "https://git.pvv.ntnu.no/mugiten/kanjivg.git"
+      }
+    },
    "nixpkgs": {
      "locked": {
-        "lastModified": 1771369470,
-        "narHash": "sha256-0NBlEBKkN3lufyvFegY4TYv5mCNHbi5OmBDrzihbBMQ=",
+        "lastModified": 1771848320,
+        "narHash": "sha256-0MAd+0mun3K/Ns8JATeHT1sX28faLII5hVLq0L3BdZU=",
        "owner": "NixOS",
        "repo": "nixpkgs",
-        "rev": "0182a361324364ae3f436a63005877674cf45efb",
+        "rev": "2fc6539b481e1d2569f25f8799236694180c0993",
        "type": "github"
      },
      "original": {
@@ -68,6 +84,7 @@
        "jmdict-src": "jmdict-src",
        "jmdict-with-examples-src": "jmdict-with-examples-src",
        "kanjidic2-src": "kanjidic2-src",
+        "kanjivg-src": "kanjivg-src",
        "nixpkgs": "nixpkgs",
        "radkfile-src": "radkfile-src"
      }
--- a/flake.nix
+++ b/flake.nix
@@ -24,6 +24,11 @@
      url = "https://www.edrdg.org/kanjidic/kanjidic2.xml.gz";
      flake = false;
    };
+
+    kanjivg-src = {
+      url = "git+https://git.pvv.ntnu.no/mugiten/kanjivg.git";
+      flake = false;
+    };
  };

  outputs = {
@@ -32,7 +37,8 @@
    jmdict-src,
    jmdict-with-examples-src,
    radkfile-src,
-    kanjidic2-src
+    kanjidic2-src,
+    kanjivg-src,
  }: let
    inherit (nixpkgs) lib;
    systems = [
@@ -80,8 +86,9 @@
        buildInputs = with pkgs; [
          dart
          gnumake
-          sqlite-interactive
+          lcov
          sqlite-analyzer
+          sqlite-interactive
          sqlite-web
          # sqlint
          sqlfluff
@@ -89,6 +96,7 @@
        env = {
          LIBSQLITE_PATH = "${pkgs.sqlite.out}/lib/libsqlite3.so";
          JADB_PATH = "result/jadb.sqlite";
+          LD_LIBRARY_PATH = lib.makeLibraryPath [ pkgs.sqlite ];
        };
      };
    });
--- a/lib/_data_ingestion/jmdict/xml_parser.dart
+++ b/lib/_data_ingestion/jmdict/xml_parser.dart
@@ -10,14 +10,15 @@ List<int?> getPriorityValues(XmlElement e, String prefix) {
    final txt = pri.innerText;
    if (txt.startsWith('news')) {
      news = int.parse(txt.substring(4));
-    } else if (txt.startsWith('ichi'))
+    } else if (txt.startsWith('ichi')) {
      ichi = int.parse(txt.substring(4));
-    else if (txt.startsWith('spec'))
+    } else if (txt.startsWith('spec')) {
      spec = int.parse(txt.substring(4));
-    else if (txt.startsWith('gai'))
+    } else if (txt.startsWith('gai')) {
      gai = int.parse(txt.substring(3));
-    else if (txt.startsWith('nf'))
+    } else if (txt.startsWith('nf')) {
      nf = int.parse(txt.substring(2));
+    }
  }
  return [news, ichi, spec, gai, nf];
 }
@@ -79,16 +80,16 @@ List<Entry> parseJMDictData(XmlElement root) {
    final List<ReadingElement> readingEls = [];
    final List<Sense> senses = [];

-    for (final (kanjiNum, k_ele) in entry.findElements('k_ele').indexed) {
-      final kePri = getPriorityValues(k_ele, 'ke');
+    for (final (kanjiNum, kEle) in entry.findElements('k_ele').indexed) {
+      final kePri = getPriorityValues(kEle, 'ke');
      kanjiEls.add(
        KanjiElement(
          orderNum: kanjiNum + 1,
-          info: k_ele
+          info: kEle
              .findElements('ke_inf')
              .map((e) => e.innerText.substring(1, e.innerText.length - 1))
              .toList(),
-          reading: k_ele.findElements('keb').first.innerText,
+          reading: kEle.findElements('keb').first.innerText,
          news: kePri[0],
          ichi: kePri[1],
          spec: kePri[2],
@@ -98,24 +99,24 @@ List<Entry> parseJMDictData(XmlElement root) {
      );
    }

-    for (final (orderNum, r_ele) in entry.findElements('r_ele').indexed) {
-      final rePri = getPriorityValues(r_ele, 're');
-      final readingDoesNotMatchKanji = r_ele
+    for (final (orderNum, rEle) in entry.findElements('r_ele').indexed) {
+      final rePri = getPriorityValues(rEle, 're');
+      final readingDoesNotMatchKanji = rEle
          .findElements('re_nokanji')
          .isNotEmpty;
      readingEls.add(
        ReadingElement(
          orderNum: orderNum + 1,
          readingDoesNotMatchKanji: readingDoesNotMatchKanji,
-          info: r_ele
+          info: rEle
              .findElements('re_inf')
              .map((e) => e.innerText.substring(1, e.innerText.length - 1))
              .toList(),
-          restrictions: r_ele
+          restrictions: rEle
              .findElements('re_restr')
              .map((e) => e.innerText)
              .toList(),
-          reading: r_ele.findElements('reb').first.innerText,
+          reading: rEle.findElements('reb').first.innerText,
          news: rePri[0],
          ichi: rePri[1],
          spec: rePri[2],
--- a/lib/_data_ingestion/kanjivg/objects.dart
+++ b/lib/_data_ingestion/kanjivg/objects.dart
@@ -0,0 +1,92 @@
+import 'package:jadb/_data_ingestion/sql_writable.dart';
+
+/// Enum set in the kvg:position attribute, used by `<g>` elements in the KanjiVG SVG files.
+enum KanjiPathGroupPosition {
+  bottom,
+  kamae,
+  kamaec,
+  left,
+  middle,
+  nyo,
+  nyoc,
+  right,
+  tare,
+  tarec,
+  top,
+}
+
+/// Contents of a \<g> element in the KanjiVG SVG files.
+class KanjiPathGroupTreeNode extends SQLWritable {
+  final String id;
+  final List<KanjiPathGroupTreeNode> children;
+  final String? element;
+  final String? original;
+  final KanjiPathGroupPosition? position;
+  final String? radical;
+  final int? part;
+
+  KanjiPathGroupTreeNode({
+    required this.id,
+    this.children = const [],
+    this.element,
+    this.original,
+    this.position,
+    this.radical,
+    this.part,
+  });
+
+  @override
+  Map<String, Object?> get sqlValue => {
+    'id': id,
+    'element': element,
+    'original': original,
+    'position': position?.name,
+    'radical': radical,
+    'part': part,
+  };
+}
+
+/// Contents of a `<text>` element in the StrokeNumber's group in the KanjiVG SVG files
+class KanjiStrokeNumber extends SQLWritable {
+  final int num;
+  final double x;
+  final double y;
+
+  KanjiStrokeNumber(this.num, this.x, this.y);
+
+  @override
+  Map<String, Object?> get sqlValue => {'num': num, 'x': x, 'y': y};
+}
+
+/// Contents of a `<path>` element in the KanjiVG SVG files
+class KanjiVGPath extends SQLWritable {
+  final String id;
+  final String type;
+  final String svgPath;
+
+  KanjiVGPath({required this.id, required this.type, required this.svgPath});
+
+  @override
+  Map<String, Object?> get sqlValue => {
+    'id': id,
+    'type': type,
+    'svgPath': svgPath,
+  };
+}
+
+class KanjiVGItem extends SQLWritable {
+  final String character;
+  final List<KanjiVGPath> paths;
+  final List<KanjiStrokeNumber> strokeNumbers;
+  final List<KanjiPathGroupTreeNode> pathGroups;
+
+  KanjiVGItem({
+    required this.character,
+    required this.paths,
+    required this.strokeNumbers,
+    required this.pathGroups,
+  });
+
+  @override
+  Map<String, Object?> get sqlValue => {'character': character};
+}
--- a/lib/_data_ingestion/kanjivg/seed_data.dart
+++ b/lib/_data_ingestion/kanjivg/seed_data.dart
@@ -0,0 +1,7 @@
+import 'package:sqflite_common/sqflite.dart';
+
+Future<void> seedKanjiVGData(Iterable<String> xmlContents, Database db) async {
+  final b = db.batch();
+
+  await b.commit(noResult: true);
+}
--- a/lib/_data_ingestion/open_local_db.dart
+++ b/lib/_data_ingestion/open_local_db.dart
@@ -19,19 +19,18 @@ Future<Database> openLocalDb({
    throw Exception('JADB_PATH does not exist: $jadbPath');
  }

-  final db =
-      await createDatabaseFactoryFfi().openDatabase(
-        jadbPath,
-        options: OpenDatabaseOptions(
-          onConfigure: (db) async {
-            if (walMode) {
-              await db.execute('PRAGMA journal_mode = WAL');
-            }
-            await db.execute('PRAGMA foreign_keys = ON');
-          },
-          readOnly: !readWrite,
-        ),
-      );
+  final db = await createDatabaseFactoryFfi().openDatabase(
+    jadbPath,
+    options: OpenDatabaseOptions(
+      onConfigure: (db) async {
+        if (walMode) {
+          await db.execute('PRAGMA journal_mode = WAL');
+        }
+        await db.execute('PRAGMA foreign_keys = ON');
+      },
+      readOnly: !readWrite,
+    ),
+  );

  if (verifyTablesExist) {
    await db.jadbVerifyTables();
--- a/lib/_data_ingestion/tanos-jlpt/overrides.dart
+++ b/lib/_data_ingestion/tanos-jlpt/overrides.dart
@@ -1,4 +1,4 @@
-const Map<(String?, String), int?> TANOS_JLPT_OVERRIDES = {
+const Map<(String?, String), int?> tanosJLPTOverrides = {
  // N5:
  (null, 'あなた'): 1223615,
  (null, 'あの'): 1000430,
--- a/lib/_data_ingestion/tanos-jlpt/resolve.dart
+++ b/lib/_data_ingestion/tanos-jlpt/resolve.dart
@@ -76,7 +76,7 @@ Future<int?> findEntry(
  if ((entryIds.isEmpty || entryIds.length > 1) && useOverrides) {
    print('No entry found, trying to fetch from overrides');
    final overrideEntries = word.readings
-        .map((reading) => TANOS_JLPT_OVERRIDES[(word.kanji, reading)])
+        .map((reading) => tanosJLPTOverrides[(word.kanji, reading)])
        .whereType<int>()
        .toSet();

@@ -86,7 +86,7 @@ Future<int?> findEntry(
      );
    } else if (overrideEntries.isEmpty &&
        !word.readings.any(
-          (reading) => TANOS_JLPT_OVERRIDES.containsKey((word.kanji, reading)),
+          (reading) => tanosJLPTOverrides.containsKey((word.kanji, reading)),
        )) {
      throw Exception(
        'No override entry found for ${word.toString()}: $entryIds',
--- a/lib/const_data/kanji_grades.dart
+++ b/lib/const_data/kanji_grades.dart
@@ -1,6 +1,5 @@
 /// Jouyou kanji sorted primarily by grades and secondarily by strokes.
-const Map<int, Map<int, List<String>>>
-JOUYOU_KANJI_BY_GRADE_AND_STROKE_COUNT = {
+const Map<int, Map<int, List<String>>> jouyouKanjiByGradeAndStrokeCount = {
  1: {
    1: ['一'],
    2: ['力', '八', '入', '二', '人', '十', '七', '九'],
@@ -1861,8 +1860,8 @@ JOUYOU_KANJI_BY_GRADE_AND_STROKE_COUNT = {
  },
 };

-final Map<int, List<String>> JOUYOU_KANJI_BY_GRADES =
-    JOUYOU_KANJI_BY_GRADE_AND_STROKE_COUNT.entries
+final Map<int, List<String>> jouyouKanjiByGrades =
+    jouyouKanjiByGradeAndStrokeCount.entries
        .expand((entry) => entry.value.entries)
        .map((entry) => MapEntry(entry.key, entry.value))
        .fold<Map<int, List<String>>>(
--- a/lib/const_data/radicals.dart
+++ b/lib/const_data/radicals.dart
@@ -1,4 +1,4 @@
-const Map<int, List<String>> RADICALS = {
+const Map<int, List<String>> radicals = {
  1: ['一', '｜', '丶', 'ノ', '乙', '亅'],
  2: [
    '二',
--- a/lib/models/verify_tables.dart
+++ b/lib/models/verify_tables.dart
@@ -1,5 +1,6 @@
 import 'package:jadb/table_names/jmdict.dart';
 import 'package:jadb/table_names/kanjidic.dart';
+import 'package:jadb/table_names/kanjivg.dart';
 import 'package:jadb/table_names/radkfile.dart';
 import 'package:jadb/table_names/tanos_jlpt.dart';
 import 'package:sqflite_common/sqlite_api.dart';
@@ -21,6 +22,7 @@ Future<void> verifyTablesWithDbConnection(DatabaseExecutor db) async {
    ...KANJIDICTableNames.allTables,
    ...RADKFILETableNames.allTables,
    ...TanosJLPTTableNames.allTables,
+    ...KanjiVGTableNames.allTables,
  };

  final missingTables = expectedTables.difference(tables);
--- a/lib/models/word_search/word_search_result.dart
+++ b/lib/models/word_search/word_search_result.dart
@@ -6,6 +6,7 @@ import 'package:jadb/models/word_search/word_search_ruby.dart';
 import 'package:jadb/models/word_search/word_search_sense.dart';
 import 'package:jadb/models/word_search/word_search_sources.dart';
 import 'package:jadb/search/word_search/word_search.dart';
+import 'package:jadb/util/romaji_transliteration.dart';

 /// A class representing a single dictionary entry from a word search.
 class WordSearchResult {
@@ -44,6 +45,35 @@ class WordSearchResult {
  /// the original searchword.
  List<WordSearchMatchSpan>? matchSpans;

+  /// All contents of [japanese], transliterated to romaji
+  List<String> get romaji => japanese
+      .map((word) => transliterateKanaToLatin(word.furigana ?? word.base))
+      .toList();
+
+  /// All contents of [japanase], where the furigana has either been transliterated to romaji, or
+  /// contains the furigana transliteration of [WordSearchRuby.base].
+  List<WordSearchRuby> get romajiRubys => japanese
+      .map(
+        (word) => WordSearchRuby(
+          base: word.base,
+          furigana: word.furigana != null
+              ? transliterateKanaToLatin(word.furigana!)
+              : transliterateKanaToLatin(word.base),
+        ),
+      )
+      .toList();
+
+  /// The same list of spans as [matchSpans], but the positions have been adjusted for romaji conversion
+  ///
+  /// This is mostly useful in conjunction with [romajiRubys].
+  List<WordSearchMatchSpan>? get romajiMatchSpans {
+    if (matchSpans == null) {
+      return null;
+    }
+
+    throw UnimplementedError('Not yet implemented');
+  }
+
  WordSearchResult({
    required this.score,
    required this.entryId,
@@ -107,7 +137,7 @@ class WordSearchResult {
  /// Infers which part(s) of this word search result matched the search keyword, and populates [matchSpans] accordingly.
  void inferMatchSpans(
    String searchword, {
-    SearchMode searchMode = SearchMode.Auto,
+    SearchMode searchMode = SearchMode.auto,
  }) {
    // TODO: handle wildcards like '?' and '*' when that becomes supported in the search.
    // TODO: If the searchMode is provided, we can use that to narrow down which part of the word search results to look at.
@@ -163,7 +193,7 @@ class WordSearchResult {
    this.matchSpans = matchSpans;
  }

-  String _formatJapaneseWord(WordSearchRuby word) =>
+  static String _formatJapaneseWord(WordSearchRuby word) =>
      word.furigana == null ? word.base : '${word.base} (${word.furigana})';

  @override
--- a/lib/search.dart
+++ b/lib/search.dart
@@ -30,7 +30,7 @@ extension JaDBConnection on DatabaseExecutor {
  /// Search for a word in the database.
  Future<List<WordSearchResult>?> jadbSearchWord(
    String word, {
-    SearchMode searchMode = SearchMode.Auto,
+    SearchMode searchMode = SearchMode.auto,
    int page = 0,
    int? pageSize,
  }) => searchWordWithDbConnection(
@@ -54,7 +54,7 @@ extension JaDBConnection on DatabaseExecutor {
  /// Search for a word in the database, and return the count of results.
  Future<int?> jadbSearchWordCount(
    String word, {
-    SearchMode searchMode = SearchMode.Auto,
+    SearchMode searchMode = SearchMode.auto,
  }) => searchWordCountWithDbConnection(this, word, searchMode: searchMode);

  /// Given a list of radicals, search which kanji contains all
--- a/lib/search/filter_kanji.dart
+++ b/lib/search/filter_kanji.dart
@@ -18,7 +18,15 @@ Future<List<String>> filterKanjiWithDbConnection(
      .then((value) => value.map((e) => e['literal'] as String).toSet());

  if (deduplicate) {
-    return filteredKanji.toList();
+    final List<String> result = [];
+    final Set<String> seen = {};
+    for (final k in kanji) {
+      if (filteredKanji.contains(k) && !seen.contains(k)) {
+        result.add(k);
+        seen.add(k);
+      }
+    }
+    return result;
  } else {
    return kanji.where((k) => filteredKanji.contains(k)).toList();
  }
--- a/lib/search/kanji_search.dart
+++ b/lib/search/kanji_search.dart
@@ -5,140 +5,186 @@ import 'package:jadb/table_names/kanjidic.dart';
 import 'package:jadb/table_names/radkfile.dart';
 import 'package:sqflite_common/sqflite.dart';

+Future<List<Map<String, Object?>>> _charactersQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.query(
+  KANJIDICTableNames.character,
+  where: 'literal = ?',
+  whereArgs: [kanji],
+);
+
+Future<List<Map<String, Object?>>> _codepointsQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.query(
+  KANJIDICTableNames.codepoint,
+  where: 'kanji = ?',
+  whereArgs: [kanji],
+);
+
+Future<List<Map<String, Object?>>> _kunyomisQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.query(
+  KANJIDICTableNames.kunyomi,
+  where: 'kanji = ?',
+  whereArgs: [kanji],
+  orderBy: 'orderNum',
+);
+
+Future<List<Map<String, Object?>>> _onyomisQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.query(
+  KANJIDICTableNames.onyomi,
+  where: 'kanji = ?',
+  whereArgs: [kanji],
+  orderBy: 'orderNum',
+);
+
+Future<List<Map<String, Object?>>> _meaningsQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.query(
+  KANJIDICTableNames.meaning,
+  where: 'kanji = ? AND language = ?',
+  whereArgs: [kanji, 'eng'],
+  orderBy: 'orderNum',
+);
+
+Future<List<Map<String, Object?>>> _nanorisQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.query(
+  KANJIDICTableNames.nanori,
+  where: 'kanji = ?',
+  whereArgs: [kanji],
+);
+
+Future<List<Map<String, Object?>>> _dictionaryReferencesQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.query(
+  KANJIDICTableNames.dictionaryReference,
+  where: 'kanji = ?',
+  whereArgs: [kanji],
+);
+
+Future<List<Map<String, Object?>>> _queryCodesQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.query(
+  KANJIDICTableNames.queryCode,
+  where: 'kanji = ?',
+  whereArgs: [kanji],
+);
+
+Future<List<Map<String, Object?>>> _radicalsQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.rawQuery(
+  '''
+    SELECT DISTINCT
+      "XREF__KANJIDIC_Radical__RADKFILE"."radicalSymbol" AS "symbol",
+      "names"
+    FROM "${KANJIDICTableNames.radical}"
+    JOIN "XREF__KANJIDIC_Radical__RADKFILE" USING ("radicalId")
+    LEFT JOIN (
+      SELECT "radicalId", group_concat("name") AS "names"
+      FROM "${KANJIDICTableNames.radicalName}"
+      GROUP BY "radicalId"
+    ) USING ("radicalId")
+    WHERE "${KANJIDICTableNames.radical}"."kanji" = ?
+  ''',
+  [kanji],
+);
+
+Future<List<Map<String, Object?>>> _partsQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.query(
+  RADKFILETableNames.radkfile,
+  where: 'kanji = ?',
+  whereArgs: [kanji],
+);
+
+Future<List<Map<String, Object?>>> _readingsQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.query(
+  KANJIDICTableNames.reading,
+  where: 'kanji = ?',
+  whereArgs: [kanji],
+);
+
+Future<List<Map<String, Object?>>> _strokeMiscountsQuery(
+  DatabaseExecutor connection,
+  String kanji,
+) => connection.query(
+  KANJIDICTableNames.strokeMiscount,
+  where: 'kanji = ?',
+  whereArgs: [kanji],
+);
+
+// Future<List<Map<String, Object?>>> _variantsQuery(
+//   DatabaseExecutor connection,
+//   String kanji,
+// ) => connection.query(
+//   KANJIDICTableNames.variant,
+//   where: 'kanji = ?',
+//   whereArgs: [kanji],
+// );
+
 /// Searches for a kanji character and returns its details, or null if the kanji is not found in the database.
 Future<KanjiSearchResult?> searchKanjiWithDbConnection(
  DatabaseExecutor connection,
  String kanji,
 ) async {
  late final List<Map<String, Object?>> characters;
-  final charactersQuery = connection.query(
-    KANJIDICTableNames.character,
-    where: 'literal = ?',
-    whereArgs: [kanji],
-  );
-
  late final List<Map<String, Object?>> codepoints;
-  final codepointsQuery = connection.query(
-    KANJIDICTableNames.codepoint,
-    where: 'kanji = ?',
-    whereArgs: [kanji],
-  );
-
  late final List<Map<String, Object?>> kunyomis;
-  final kunyomisQuery = connection.query(
-    KANJIDICTableNames.kunyomi,
-    where: 'kanji = ?',
-    whereArgs: [kanji],
-    orderBy: 'orderNum',
-  );
-
  late final List<Map<String, Object?>> onyomis;
-  final onyomisQuery = connection.query(
-    KANJIDICTableNames.onyomi,
-    where: 'kanji = ?',
-    whereArgs: [kanji],
-    orderBy: 'orderNum',
-  );
-
  late final List<Map<String, Object?>> meanings;
-  final meaningsQuery = connection.query(
-    KANJIDICTableNames.meaning,
-    where: 'kanji = ? AND language = ?',
-    whereArgs: [kanji, 'eng'],
-    orderBy: 'orderNum',
-  );
-
  late final List<Map<String, Object?>> nanoris;
-  final nanorisQuery = connection.query(
-    KANJIDICTableNames.nanori,
-    where: 'kanji = ?',
-    whereArgs: [kanji],
-  );
-
  late final List<Map<String, Object?>> dictionaryReferences;
-  final dictionaryReferencesQuery = connection.query(
-    KANJIDICTableNames.dictionaryReference,
-    where: 'kanji = ?',
-    whereArgs: [kanji],
-  );
-
  late final List<Map<String, Object?>> queryCodes;
-  final queryCodesQuery = connection.query(
-    KANJIDICTableNames.queryCode,
-    where: 'kanji = ?',
-    whereArgs: [kanji],
-  );
-
  late final List<Map<String, Object?>> radicals;
-  final radicalsQuery = connection.rawQuery(
-    '''
-      SELECT DISTINCT
-        "XREF__KANJIDIC_Radical__RADKFILE"."radicalSymbol" AS "symbol",
-        "names"
-      FROM "${KANJIDICTableNames.radical}"
-      JOIN "XREF__KANJIDIC_Radical__RADKFILE" USING ("radicalId")
-      LEFT JOIN (
-        SELECT "radicalId", group_concat("name") AS "names"
-        FROM "${KANJIDICTableNames.radicalName}"
-        GROUP BY "radicalId"
-      ) USING ("radicalId")
-      WHERE "${KANJIDICTableNames.radical}"."kanji" = ?
-    ''',
-    [kanji],
-  );
-
  late final List<Map<String, Object?>> parts;
-  final partsQuery = connection.query(
-    RADKFILETableNames.radkfile,
-    where: 'kanji = ?',
-    whereArgs: [kanji],
-  );
-
  late final List<Map<String, Object?>> readings;
-  final readingsQuery = connection.query(
-    KANJIDICTableNames.reading,
-    where: 'kanji = ?',
-    whereArgs: [kanji],
-  );
-
  late final List<Map<String, Object?>> strokeMiscounts;
-  final strokeMiscountsQuery = connection.query(
-    KANJIDICTableNames.strokeMiscount,
-    where: 'kanji = ?',
-    whereArgs: [kanji],
-  );
-
  // TODO: add variant data to result
  // late final List<Map<String, Object?>> variants;
-  // final variants_query = connection.query(
-  //   KANJIDICTableNames.variant,
-  //   where: "kanji = ?",
-  //   whereArgs: [kanji],
-  // );

  // TODO: Search for kunyomi and onyomi usage of the characters
-  //       from JMDict. We'll need to fuzzy aquery JMDict_KanjiElement for mathces,
+  //       from JMDict. We'll need to fuzzy aquery JMDict_KanjiElement for matches,
  //       filter JMdict_ReadingElement for kunyomi/onyomi, and then sort the main entry
  //       by JLPT, news frequency, etc.

-  await charactersQuery.then((value) => characters = value);
+  await _charactersQuery(connection, kanji).then((value) => characters = value);

  if (characters.isEmpty) {
    return null;
  }

  await Future.wait({
-    codepointsQuery.then((value) => codepoints = value),
-    kunyomisQuery.then((value) => kunyomis = value),
-    onyomisQuery.then((value) => onyomis = value),
-    meaningsQuery.then((value) => meanings = value),
-    nanorisQuery.then((value) => nanoris = value),
-    dictionaryReferencesQuery.then((value) => dictionaryReferences = value),
-    queryCodesQuery.then((value) => queryCodes = value),
-    radicalsQuery.then((value) => radicals = value),
-    partsQuery.then((value) => parts = value),
-    readingsQuery.then((value) => readings = value),
-    strokeMiscountsQuery.then((value) => strokeMiscounts = value),
+    _codepointsQuery(connection, kanji).then((value) => codepoints = value),
+    _kunyomisQuery(connection, kanji).then((value) => kunyomis = value),
+    _onyomisQuery(connection, kanji).then((value) => onyomis = value),
+    _meaningsQuery(connection, kanji).then((value) => meanings = value),
+    _nanorisQuery(connection, kanji).then((value) => nanoris = value),
+    _dictionaryReferencesQuery(
+      connection,
+      kanji,
+    ).then((value) => dictionaryReferences = value),
+    _queryCodesQuery(connection, kanji).then((value) => queryCodes = value),
+    _radicalsQuery(connection, kanji).then((value) => radicals = value),
+    _partsQuery(connection, kanji).then((value) => parts = value),
+    _readingsQuery(connection, kanji).then((value) => readings = value),
+    _strokeMiscountsQuery(
+      connection,
+      kanji,
+    ).then((value) => strokeMiscounts = value),
    // variants_query.then((value) => variants = value),
  });

--- a/lib/search/word_search/data_query.dart
+++ b/lib/search/word_search/data_query.dart
@@ -53,274 +53,363 @@ class LinearWordQueryData {
  });
 }

+Future<List<Map<String, Object?>>> _sensesQuery(
+  DatabaseExecutor connection,
+  List<int> entryIds,
+) => connection.query(
+  JMdictTableNames.sense,
+  where: 'entryId IN (${List.filled(entryIds.length, '?').join(',')})',
+  whereArgs: entryIds,
+);
+
+Future<List<Map<String, Object?>>> _readingelementsQuery(
+  DatabaseExecutor connection,
+  List<int> entryIds,
+) => connection.query(
+  JMdictTableNames.readingElement,
+  where: 'entryId IN (${List.filled(entryIds.length, '?').join(',')})',
+  whereArgs: entryIds,
+  orderBy: 'orderNum',
+);
+
+Future<List<Map<String, Object?>>> _kanjielementsQuery(
+  DatabaseExecutor connection,
+  List<int> entryIds,
+) => connection.query(
+  JMdictTableNames.kanjiElement,
+  where: 'entryId IN (${List.filled(entryIds.length, '?').join(',')})',
+  whereArgs: entryIds,
+  orderBy: 'orderNum',
+);
+
+Future<List<Map<String, Object?>>> _jlpttagsQuery(
+  DatabaseExecutor connection,
+  List<int> entryIds,
+) => connection.query(
+  TanosJLPTTableNames.jlptTag,
+  where: 'entryId IN (${List.filled(entryIds.length, '?').join(',')})',
+  whereArgs: entryIds,
+);
+
+Future<List<Map<String, Object?>>> _commonentriesQuery(
+  DatabaseExecutor connection,
+  List<int> entryIds,
+) => connection.query(
+  'JMdict_EntryCommon',
+  where: 'entryId IN (${List.filled(entryIds.length, '?').join(',')})',
+  whereArgs: entryIds,
+);
+
+// Sense queries
+
+Future<List<Map<String, Object?>>> _senseantonymsQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.rawQuery(
+  """
+      SELECT
+        "${JMdictTableNames.senseAntonyms}".senseId,
+        "${JMdictTableNames.senseAntonyms}".ambiguous,
+        "${JMdictTableNames.senseAntonyms}".xrefEntryId,
+        "JMdict_BaseAndFurigana"."base",
+        "JMdict_BaseAndFurigana"."furigana"
+      FROM "${JMdictTableNames.senseAntonyms}"
+      JOIN "JMdict_BaseAndFurigana"
+        ON "${JMdictTableNames.senseAntonyms}"."xrefEntryId" = "JMdict_BaseAndFurigana"."entryId"
+      WHERE
+        "senseId" IN (${List.filled(senseIds.length, '?').join(',')})
+        AND "JMdict_BaseAndFurigana"."isFirst"
+      ORDER BY
+        "${JMdictTableNames.senseAntonyms}"."senseId",
+        "${JMdictTableNames.senseAntonyms}"."xrefEntryId"
+  """,
+  [...senseIds],
+);
+
+Future<List<Map<String, Object?>>> _senseseealsosQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.rawQuery(
+  """
+      SELECT
+        "${JMdictTableNames.senseSeeAlso}"."senseId",
+        "${JMdictTableNames.senseSeeAlso}"."ambiguous",
+        "${JMdictTableNames.senseSeeAlso}"."xrefEntryId",
+        "JMdict_BaseAndFurigana"."base",
+        "JMdict_BaseAndFurigana"."furigana"
+      FROM "${JMdictTableNames.senseSeeAlso}"
+      JOIN "JMdict_BaseAndFurigana"
+        ON "${JMdictTableNames.senseSeeAlso}"."xrefEntryId" = "JMdict_BaseAndFurigana"."entryId"
+      WHERE
+        "senseId" IN (${List.filled(senseIds.length, '?').join(',')})
+        AND "JMdict_BaseAndFurigana"."isFirst"
+      ORDER BY
+        "${JMdictTableNames.senseSeeAlso}"."senseId",
+        "${JMdictTableNames.senseSeeAlso}"."xrefEntryId"
+  """,
+  [...senseIds],
+);
+
+Future<List<Map<String, Object?>>> _sensedialectsQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.query(
+  JMdictTableNames.senseDialect,
+  where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
+  whereArgs: senseIds,
+);
+
+Future<List<Map<String, Object?>>> _sensefieldsQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.query(
+  JMdictTableNames.senseField,
+  where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
+  whereArgs: senseIds,
+);
+
+Future<List<Map<String, Object?>>> _senseglossariesQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.query(
+  JMdictTableNames.senseGlossary,
+  where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
+  whereArgs: senseIds,
+);
+
+Future<List<Map<String, Object?>>> _senseinfosQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.query(
+  JMdictTableNames.senseInfo,
+  where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
+  whereArgs: senseIds,
+);
+
+Future<List<Map<String, Object?>>> _senselanguagesourcesQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.query(
+  JMdictTableNames.senseLanguageSource,
+  where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
+  whereArgs: senseIds,
+);
+
+Future<List<Map<String, Object?>>> _sensemiscsQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.query(
+  JMdictTableNames.senseMisc,
+  where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
+  whereArgs: senseIds,
+);
+
+Future<List<Map<String, Object?>>> _sensepossQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.query(
+  JMdictTableNames.sensePOS,
+  where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
+  whereArgs: senseIds,
+);
+
+Future<List<Map<String, Object?>>> _senserestrictedtokanjisQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.query(
+  JMdictTableNames.senseRestrictedToKanji,
+  where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
+  whereArgs: senseIds,
+);
+
+Future<List<Map<String, Object?>>> _senserestrictedtoreadingsQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.query(
+  JMdictTableNames.senseRestrictedToReading,
+  where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
+  whereArgs: senseIds,
+);
+
+Future<List<Map<String, Object?>>> _examplesentencesQuery(
+  DatabaseExecutor connection,
+  List<int> senseIds,
+) => connection.query(
+  'JMdict_ExampleSentence',
+  where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
+  whereArgs: senseIds,
+);
+
+// Reading/kanji elements queries
+
+Future<List<Map<String, Object?>>> _readingelementinfosQuery(
+  DatabaseExecutor connection,
+  List<int> readingIds,
+) => connection.query(
+  JMdictTableNames.readingInfo,
+  where: '(elementId) IN (${List.filled(readingIds.length, '?').join(',')})',
+  whereArgs: readingIds,
+);
+
+Future<List<Map<String, Object?>>> _readingelementrestrictionsQuery(
+  DatabaseExecutor connection,
+  List<int> readingIds,
+) => connection.query(
+  JMdictTableNames.readingRestriction,
+  where: '(elementId) IN (${List.filled(readingIds.length, '?').join(',')})',
+  whereArgs: readingIds,
+);
+
+Future<List<Map<String, Object?>>> _kanjielementinfosQuery(
+  DatabaseExecutor connection,
+  List<int> kanjiIds,
+) => connection.query(
+  JMdictTableNames.kanjiInfo,
+  where: '(elementId) IN (${List.filled(kanjiIds.length, '?').join(',')})',
+  whereArgs: kanjiIds,
+);
+
+// Xref queries
+
+Future<LinearWordQueryData?> _senseantonymdataQuery(
+  DatabaseExecutor connection,
+  List<int> entryIds,
+) => fetchLinearWordQueryData(connection, entryIds, fetchXrefData: false);
+
+Future<LinearWordQueryData?> _senseseealsodataQuery(
+  DatabaseExecutor connection,
+  List<int> entryIds,
+) => fetchLinearWordQueryData(connection, entryIds, fetchXrefData: false);
+
+// Full query
+
 Future<LinearWordQueryData> fetchLinearWordQueryData(
  DatabaseExecutor connection,
  List<int> entryIds, {
  bool fetchXrefData = true,
 }) async {
  late final List<Map<String, Object?>> senses;
-  final Future<List<Map<String, Object?>>> sensesQuery = connection.query(
-    JMdictTableNames.sense,
-    where: 'entryId IN (${List.filled(entryIds.length, '?').join(',')})',
-    whereArgs: entryIds,
-  );
-
  late final List<Map<String, Object?>> readingElements;
-  final Future<List<Map<String, Object?>>> readingelementsQuery = connection
-      .query(
-        JMdictTableNames.readingElement,
-        where: 'entryId IN (${List.filled(entryIds.length, '?').join(',')})',
-        whereArgs: entryIds,
-        orderBy: 'orderNum',
-      );
-
  late final List<Map<String, Object?>> kanjiElements;
-  final Future<List<Map<String, Object?>>> kanjielementsQuery = connection
-      .query(
-        JMdictTableNames.kanjiElement,
-        where: 'entryId IN (${List.filled(entryIds.length, '?').join(',')})',
-        whereArgs: entryIds,
-        orderBy: 'orderNum',
-      );
-
  late final List<Map<String, Object?>> jlptTags;
-  final Future<List<Map<String, Object?>>> jlpttagsQuery = connection.query(
-    TanosJLPTTableNames.jlptTag,
-    where: 'entryId IN (${List.filled(entryIds.length, '?').join(',')})',
-    whereArgs: entryIds,
-  );
-
  late final List<Map<String, Object?>> commonEntries;
-  final Future<List<Map<String, Object?>>> commonentriesQuery = connection
-      .query(
-        'JMdict_EntryCommon',
-        where: 'entryId IN (${List.filled(entryIds.length, '?').join(',')})',
-        whereArgs: entryIds,
-      );

  await Future.wait([
-    sensesQuery.then((value) => senses = value),
-    readingelementsQuery.then((value) => readingElements = value),
-    kanjielementsQuery.then((value) => kanjiElements = value),
-    jlpttagsQuery.then((value) => jlptTags = value),
-    commonentriesQuery.then((value) => commonEntries = value),
+    _sensesQuery(connection, entryIds).then((value) => senses = value),
+    _readingelementsQuery(
+      connection,
+      entryIds,
+    ).then((value) => readingElements = value),
+    _kanjielementsQuery(
+      connection,
+      entryIds,
+    ).then((value) => kanjiElements = value),
+    _jlpttagsQuery(connection, entryIds).then((value) => jlptTags = value),
+    _commonentriesQuery(
+      connection,
+      entryIds,
+    ).then((value) => commonEntries = value),
  ]);

-  // Sense queries
-
  final senseIds = senses.map((sense) => sense['senseId'] as int).toList();

  late final List<Map<String, Object?>> senseAntonyms;
-  final Future<List<Map<String, Object?>>> senseantonymsQuery = connection
-      .rawQuery(
-        """
-        SELECT
-          "${JMdictTableNames.senseAntonyms}".senseId,
-          "${JMdictTableNames.senseAntonyms}".ambiguous,
-          "${JMdictTableNames.senseAntonyms}".xrefEntryId,
-          "JMdict_BaseAndFurigana"."base",
-          "JMdict_BaseAndFurigana"."furigana"
-        FROM "${JMdictTableNames.senseAntonyms}"
-        JOIN "JMdict_BaseAndFurigana"
-          ON "${JMdictTableNames.senseAntonyms}"."xrefEntryId" = "JMdict_BaseAndFurigana"."entryId"
-        WHERE
-          "senseId" IN (${List.filled(senseIds.length, '?').join(',')})
-          AND "JMdict_BaseAndFurigana"."isFirst"
-        ORDER BY
-          "${JMdictTableNames.senseAntonyms}"."senseId",
-          "${JMdictTableNames.senseAntonyms}"."xrefEntryId"
-    """,
-        [...senseIds],
-      );
-
  late final List<Map<String, Object?>> senseDialects;
-  final Future<List<Map<String, Object?>>> sensedialectsQuery = connection
-      .query(
-        JMdictTableNames.senseDialect,
-        where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
-        whereArgs: senseIds,
-      );
-
  late final List<Map<String, Object?>> senseFields;
-  final Future<List<Map<String, Object?>>> sensefieldsQuery = connection.query(
-    JMdictTableNames.senseField,
-    where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
-    whereArgs: senseIds,
-  );
-
  late final List<Map<String, Object?>> senseGlossaries;
-  final Future<List<Map<String, Object?>>> senseglossariesQuery = connection
-      .query(
-        JMdictTableNames.senseGlossary,
-        where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
-        whereArgs: senseIds,
-      );
-
  late final List<Map<String, Object?>> senseInfos;
-  final Future<List<Map<String, Object?>>> senseinfosQuery = connection.query(
-    JMdictTableNames.senseInfo,
-    where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
-    whereArgs: senseIds,
-  );
-
  late final List<Map<String, Object?>> senseLanguageSources;
-  final Future<List<Map<String, Object?>>> senselanguagesourcesQuery =
-      connection.query(
-        JMdictTableNames.senseLanguageSource,
-        where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
-        whereArgs: senseIds,
-      );
-
  late final List<Map<String, Object?>> senseMiscs;
-  final Future<List<Map<String, Object?>>> sensemiscsQuery = connection.query(
-    JMdictTableNames.senseMisc,
-    where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
-    whereArgs: senseIds,
-  );
-
  late final List<Map<String, Object?>> sensePOSs;
-  final Future<List<Map<String, Object?>>> sensepossQuery = connection.query(
-    JMdictTableNames.sensePOS,
-    where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
-    whereArgs: senseIds,
-  );
-
  late final List<Map<String, Object?>> senseRestrictedToKanjis;
-  final Future<List<Map<String, Object?>>> senserestrictedtokanjisQuery =
-      connection.query(
-        JMdictTableNames.senseRestrictedToKanji,
-        where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
-        whereArgs: senseIds,
-      );
-
  late final List<Map<String, Object?>> senseRestrictedToReadings;
-  final Future<List<Map<String, Object?>>> senserestrictedtoreadingsQuery =
-      connection.query(
-        JMdictTableNames.senseRestrictedToReading,
-        where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
-        whereArgs: senseIds,
-      );
-
  late final List<Map<String, Object?>> senseSeeAlsos;
-  final Future<List<Map<String, Object?>>> senseseealsosQuery = connection
-      .rawQuery(
-        """
-        SELECT
-          "${JMdictTableNames.senseSeeAlso}"."senseId",
-          "${JMdictTableNames.senseSeeAlso}"."ambiguous",
-          "${JMdictTableNames.senseSeeAlso}"."xrefEntryId",
-          "JMdict_BaseAndFurigana"."base",
-          "JMdict_BaseAndFurigana"."furigana"
-        FROM "${JMdictTableNames.senseSeeAlso}"
-        JOIN "JMdict_BaseAndFurigana"
-          ON "${JMdictTableNames.senseSeeAlso}"."xrefEntryId" = "JMdict_BaseAndFurigana"."entryId"
-        WHERE
-          "senseId" IN (${List.filled(senseIds.length, '?').join(',')})
-          AND "JMdict_BaseAndFurigana"."isFirst"
-        ORDER BY
-          "${JMdictTableNames.senseSeeAlso}"."senseId",
-          "${JMdictTableNames.senseSeeAlso}"."xrefEntryId"
-    """,
-        [...senseIds],
-      );
-
  late final List<Map<String, Object?>> exampleSentences;
-  final Future<List<Map<String, Object?>>> examplesentencesQuery = connection
-      .query(
-        'JMdict_ExampleSentence',
-        where: 'senseId IN (${List.filled(senseIds.length, '?').join(',')})',
-        whereArgs: senseIds,
-      );
-
-  // Reading queries

  final readingIds = readingElements
      .map((element) => element['elementId'] as int)
      .toList();

-  late final List<Map<String, Object?>> readingElementInfos;
-  final Future<List<Map<String, Object?>>> readingelementinfosQuery =
-      connection.query(
-        JMdictTableNames.readingInfo,
-        where:
-            '(elementId) IN (${List.filled(readingIds.length, '?').join(',')})',
-        whereArgs: readingIds,
-      );
-
-  late final List<Map<String, Object?>> readingElementRestrictions;
-  final Future<List<Map<String, Object?>>> readingelementrestrictionsQuery =
-      connection.query(
-        JMdictTableNames.readingRestriction,
-        where:
-            '(elementId) IN (${List.filled(readingIds.length, '?').join(',')})',
-        whereArgs: readingIds,
-      );
-
-  // Kanji queries
-
  final kanjiIds = kanjiElements
      .map((element) => element['elementId'] as int)
      .toList();

+  late final List<Map<String, Object?>> readingElementInfos;
+  late final List<Map<String, Object?>> readingElementRestrictions;
+
  late final List<Map<String, Object?>> kanjiElementInfos;
-  final Future<List<Map<String, Object?>>> kanjielementinfosQuery = connection
-      .query(
-        JMdictTableNames.kanjiInfo,
-        where:
-            '(elementId) IN (${List.filled(kanjiIds.length, '?').join(',')})',
-        whereArgs: kanjiIds,
-      );

  // Xref data queries
  await Future.wait([
-    senseantonymsQuery.then((value) => senseAntonyms = value),
-    senseseealsosQuery.then((value) => senseSeeAlsos = value),
+    _senseantonymsQuery(
+      connection,
+      senseIds,
+    ).then((value) => senseAntonyms = value),
+    _senseseealsosQuery(
+      connection,
+      senseIds,
+    ).then((value) => senseSeeAlsos = value),
  ]);

-  late final LinearWordQueryData? senseAntonymData;
-  final Future<LinearWordQueryData?> senseantonymdataQuery =
-      fetchXrefData
-      ? fetchLinearWordQueryData(
-          connection,
-          senseAntonyms
-              .map((antonym) => antonym['xrefEntryId'] as int)
-              .toList(),
-          fetchXrefData: false,
-        )
-      : Future.value(null);
-
-  late final LinearWordQueryData? senseSeeAlsoData;
-  final Future<LinearWordQueryData?> senseseealsodataQuery =
-      fetchXrefData
-      ? fetchLinearWordQueryData(
-          connection,
-          senseSeeAlsos.map((seeAlso) => seeAlso['xrefEntryId'] as int).toList(),
-          fetchXrefData: false,
-        )
-      : Future.value(null);
+  LinearWordQueryData? senseAntonymData;
+  LinearWordQueryData? senseSeeAlsoData;

  await Future.wait([
-    sensedialectsQuery.then((value) => senseDialects = value),
-    sensefieldsQuery.then((value) => senseFields = value),
-    senseglossariesQuery.then((value) => senseGlossaries = value),
-    senseinfosQuery.then((value) => senseInfos = value),
-    senselanguagesourcesQuery.then((value) => senseLanguageSources = value),
-    sensemiscsQuery.then((value) => senseMiscs = value),
-    sensepossQuery.then((value) => sensePOSs = value),
-    senserestrictedtokanjisQuery.then(
-      (value) => senseRestrictedToKanjis = value,
-    ),
-    senserestrictedtoreadingsQuery.then(
-      (value) => senseRestrictedToReadings = value,
-    ),
-    examplesentencesQuery.then((value) => exampleSentences = value),
-    readingelementinfosQuery.then((value) => readingElementInfos = value),
-    readingelementrestrictionsQuery.then(
-      (value) => readingElementRestrictions = value,
-    ),
-    kanjielementinfosQuery.then((value) => kanjiElementInfos = value),
-    senseantonymdataQuery.then((value) => senseAntonymData = value),
-    senseseealsodataQuery.then((value) => senseSeeAlsoData = value),
+    _sensedialectsQuery(
+      connection,
+      senseIds,
+    ).then((value) => senseDialects = value),
+    _sensefieldsQuery(
+      connection,
+      senseIds,
+    ).then((value) => senseFields = value),
+    _senseglossariesQuery(
+      connection,
+      senseIds,
+    ).then((value) => senseGlossaries = value),
+    _senseinfosQuery(connection, senseIds).then((value) => senseInfos = value),
+    _senselanguagesourcesQuery(
+      connection,
+      senseIds,
+    ).then((value) => senseLanguageSources = value),
+    _sensemiscsQuery(connection, senseIds).then((value) => senseMiscs = value),
+    _sensepossQuery(connection, senseIds).then((value) => sensePOSs = value),
+    _senserestrictedtokanjisQuery(
+      connection,
+      senseIds,
+    ).then((value) => senseRestrictedToKanjis = value),
+    _senserestrictedtoreadingsQuery(
+      connection,
+      senseIds,
+    ).then((value) => senseRestrictedToReadings = value),
+    _examplesentencesQuery(
+      connection,
+      senseIds,
+    ).then((value) => exampleSentences = value),
+    _readingelementinfosQuery(
+      connection,
+      readingIds,
+    ).then((value) => readingElementInfos = value),
+    _readingelementrestrictionsQuery(
+      connection,
+      readingIds,
+    ).then((value) => readingElementRestrictions = value),
+    _kanjielementinfosQuery(
+      connection,
+      kanjiIds,
+    ).then((value) => kanjiElementInfos = value),
+
+    if (fetchXrefData)
+      _senseantonymdataQuery(
+        connection,
+        senseAntonyms.map((antonym) => antonym['xrefEntryId'] as int).toList(),
+      ).then((value) => senseAntonymData = value),
+
+    if (fetchXrefData)
+      _senseseealsodataQuery(
+        connection,
+        senseSeeAlsos.map((seeAlso) => seeAlso['xrefEntryId'] as int).toList(),
+      ).then((value) => senseSeeAlsoData = value),
  ]);

  return LinearWordQueryData(
--- a/lib/search/word_search/entry_id_query.dart
+++ b/lib/search/word_search/entry_id_query.dart
@@ -15,15 +15,15 @@ SearchMode _determineSearchMode(String word) {
  final bool containsAscii = RegExp(r'[A-Za-z]').hasMatch(word);

  if (containsKanji && containsAscii) {
-    return SearchMode.MixedKanji;
+    return SearchMode.mixedKanji;
  } else if (containsKanji) {
-    return SearchMode.Kanji;
+    return SearchMode.kanji;
  } else if (containsAscii) {
-    return SearchMode.English;
+    return SearchMode.english;
  } else if (word.contains(hiraganaRegex) || word.contains(katakanaRegex)) {
-    return SearchMode.Kana;
+    return SearchMode.kana;
  } else {
-    return SearchMode.MixedKana;
+    return SearchMode.mixedKana;
  }
 }

@@ -199,23 +199,23 @@ Future<List<ScoredEntryId>> _queryEnglish(
    SELECT
      "${JMdictTableNames.sense}"."entryId",
      MAX("JMdict_EntryScore"."score")
-      + (("${JMdictTableNames.senseGlossary}"."phrase" = ? AND "${JMdictTableNames.sense}"."orderNum" = 1) * 50)
-      + (("${JMdictTableNames.senseGlossary}"."phrase" = ? AND "${JMdictTableNames.sense}"."orderNum" = 2) * 30)
-      + (("${JMdictTableNames.senseGlossary}"."phrase" = ?) * 20)
+      + (("${JMdictTableNames.senseGlossary}"."phrase" = ?1 AND "${JMdictTableNames.sense}"."orderNum" = 1) * 50)
+      + (("${JMdictTableNames.senseGlossary}"."phrase" = ?1 AND "${JMdictTableNames.sense}"."orderNum" = 2) * 30)
+      + (("${JMdictTableNames.senseGlossary}"."phrase" = ?1) * 20)
      as "score"
    FROM "${JMdictTableNames.senseGlossary}"
    JOIN "${JMdictTableNames.sense}" USING ("senseId")
    JOIN "JMdict_EntryScore" USING ("entryId")
-    WHERE "${JMdictTableNames.senseGlossary}"."phrase" LIKE ?
+    WHERE "${JMdictTableNames.senseGlossary}"."phrase" LIKE ?2
    GROUP BY "JMdict_EntryScore"."entryId"
    ORDER BY
      "score" DESC,
      "${JMdictTableNames.sense}"."entryId" ASC
-    LIMIT ?
-    OFFSET ?
+    ${pageSize != null ? 'LIMIT ?3' : ''}
+    ${offset != null ? 'OFFSET ?4' : ''}
  '''
        .trim(),
-    [word, word, word, '%${word.replaceAll('%', '')}%', pageSize, offset],
+    [word, '%${word.replaceAll('%', '')}%', if (pageSize != null) pageSize, if (offset != null) offset],
  );

  return result
@@ -246,7 +246,7 @@ Future<List<ScoredEntryId>> fetchEntryIds(
  int? pageSize,
  int? offset,
 ) async {
-  if (searchMode == SearchMode.Auto) {
+  if (searchMode == SearchMode.auto) {
    searchMode = _determineSearchMode(word);
  }

@@ -254,20 +254,20 @@ Future<List<ScoredEntryId>> fetchEntryIds(

  late final List<ScoredEntryId> entryIds;
  switch (searchMode) {
-    case SearchMode.Kanji:
+    case SearchMode.kanji:
      entryIds = await _queryKanji(connection, word, pageSize, offset);
      break;

-    case SearchMode.Kana:
+    case SearchMode.kana:
      entryIds = await _queryKana(connection, word, pageSize, offset);
      break;

-    case SearchMode.English:
+    case SearchMode.english:
      entryIds = await _queryEnglish(connection, word, pageSize, offset);
      break;

-    case SearchMode.MixedKana:
-    case SearchMode.MixedKanji:
+    case SearchMode.mixedKana:
+    case SearchMode.mixedKanji:
    default:
      throw UnimplementedError('Search mode $searchMode is not implemented');
  }
@@ -280,7 +280,7 @@ Future<int?> fetchEntryIdCount(
  String word,
  SearchMode searchMode,
 ) async {
-  if (searchMode == SearchMode.Auto) {
+  if (searchMode == SearchMode.auto) {
    searchMode = _determineSearchMode(word);
  }

@@ -289,20 +289,20 @@ Future<int?> fetchEntryIdCount(
  late final int? entryIdCount;

  switch (searchMode) {
-    case SearchMode.Kanji:
+    case SearchMode.kanji:
      entryIdCount = await _queryKanjiCount(connection, word);
      break;

-    case SearchMode.Kana:
+    case SearchMode.kana:
      entryIdCount = await _queryKanaCount(connection, word);
      break;

-    case SearchMode.English:
+    case SearchMode.english:
      entryIdCount = await _queryEnglishCount(connection, word);
      break;

-    case SearchMode.MixedKana:
-    case SearchMode.MixedKanji:
+    case SearchMode.mixedKana:
+    case SearchMode.mixedKanji:
    default:
      throw UnimplementedError('Search mode $searchMode is not implemented');
  }
--- a/lib/search/word_search/regrouping.dart
+++ b/lib/search/word_search/regrouping.dart
@@ -54,7 +54,7 @@ List<WordSearchResult> regroupWordSearchResults({
        .where((element) => element['entryId'] == scoredEntryId.entryId)
        .toList();

-    final GroupedWordResult entryReadingElementsGrouped = _regroup_words(
+    final GroupedWordResult entryReadingElementsGrouped = _regroupWords(
      entryId: scoredEntryId.entryId,
      readingElements: entryReadingElements,
      kanjiElements: entryKanjiElements,
@@ -64,7 +64,7 @@ List<WordSearchResult> regroupWordSearchResults({
      kanjiElementInfos: linearWordQueryData.kanjiElementInfos,
    );

-    final List<WordSearchSense> entrySensesGrouped = _regroup_senses(
+    final List<WordSearchSense> entrySensesGrouped = _regroupSenses(
      senses: entrySenses,
      senseAntonyms: linearWordQueryData.senseAntonyms,
      senseDialects: linearWordQueryData.senseDialects,
@@ -112,7 +112,7 @@ class GroupedWordResult {
  });
 }

-GroupedWordResult _regroup_words({
+GroupedWordResult _regroupWords({
  required int entryId,
  required List<Map<String, Object?>> kanjiElements,
  required List<Map<String, Object?>> kanjiElementInfos,
@@ -195,7 +195,7 @@ GroupedWordResult _regroup_words({
  );
 }

-List<WordSearchSense> _regroup_senses({
+List<WordSearchSense> _regroupSenses({
  required List<Map<String, Object?>> senses,
  required List<Map<String, Object?>> senseAntonyms,
  required List<Map<String, Object?>> senseDialects,
--- a/lib/search/word_search/word_search.dart
+++ b/lib/search/word_search/word_search.dart
@@ -13,13 +13,31 @@ import 'package:jadb/search/word_search/regrouping.dart';
 import 'package:jadb/table_names/jmdict.dart';
 import 'package:sqflite_common/sqlite_api.dart';

-enum SearchMode { Auto, English, Kanji, MixedKanji, Kana, MixedKana }
+enum SearchMode {
+  /// Try to autodetect what is being searched for
+  auto,
+
+  /// Search for english words
+  english,
+
+  /// Search for the kanji reading of a word
+  kanji,
+
+  /// Search for the kanji reading of a word, mixed in with kana/romaji
+  mixedKanji,
+
+  /// Search for the kana reading of a word
+  kana,
+
+  /// Search for the kana reading of a word, mixed in with romaji
+  mixedKana,
+}

 /// Searches for an input string, returning a list of results with their details. Returns null if the input string is empty.
 Future<List<WordSearchResult>?> searchWordWithDbConnection(
  DatabaseExecutor connection,
  String word, {
-  SearchMode searchMode = SearchMode.Auto,
+  SearchMode searchMode = SearchMode.auto,
  int page = 0,
  int? pageSize,
 }) async {
@@ -63,7 +81,7 @@ Future<List<WordSearchResult>?> searchWordWithDbConnection(
 Future<int?> searchWordCountWithDbConnection(
  DatabaseExecutor connection,
  String word, {
-  SearchMode searchMode = SearchMode.Auto,
+  SearchMode searchMode = SearchMode.auto,
 }) async {
  if (word.isEmpty) {
    return null;
--- a/lib/table_names/jmdict.dart
+++ b/lib/table_names/jmdict.dart
@@ -1,4 +1,5 @@
 abstract class JMdictTableNames {
+  static const String version = 'JMdict_Version';
  static const String entry = 'JMdict_Entry';
  static const String kanjiElement = 'JMdict_KanjiElement';
  static const String kanjiInfo = 'JMdict_KanjiElementInfo';
@@ -20,6 +21,7 @@ abstract class JMdictTableNames {
  static const String senseSeeAlso = 'JMdict_SenseSeeAlso';

  static Set<String> get allTables => {
+    version,
    entry,
    kanjiElement,
    kanjiInfo,
--- a/lib/table_names/kanjidic.dart
+++ b/lib/table_names/kanjidic.dart
@@ -1,4 +1,5 @@
 abstract class KANJIDICTableNames {
+  static const String version = 'KANJIDIC_Version';
  static const String character = 'KANJIDIC_Character';
  static const String radicalName = 'KANJIDIC_RadicalName';
  static const String codepoint = 'KANJIDIC_Codepoint';
@@ -17,6 +18,7 @@ abstract class KANJIDICTableNames {
  static const String nanori = 'KANJIDIC_Nanori';

  static Set<String> get allTables => {
+    version,
    character,
    radicalName,
    codepoint,
--- a/lib/table_names/kanjivg.dart
+++ b/lib/table_names/kanjivg.dart
@@ -0,0 +1,9 @@
+abstract class KanjiVGTableNames {
+  static const String version = 'KanjiVG_Version';
+  static const String entry = 'KanjiVG_Entry';
+  static const String path = 'KanjiVG_Path';
+  static const String strokeNumber = 'KanjiVG_StrokeNumber';
+  static const String pathGroup = 'KanjiVG_PathGroup';
+
+  static Set<String> get allTables => {version, entry, path, strokeNumber, pathGroup};
+}
--- a/lib/table_names/radkfile.dart
+++ b/lib/table_names/radkfile.dart
@@ -1,5 +1,6 @@
 abstract class RADKFILETableNames {
+  static const String version = 'RADKFILE_Version';
  static const String radkfile = 'RADKFILE';

-  static Set<String> get allTables => {radkfile};
+  static Set<String> get allTables => {version, radkfile};
 }
--- a/lib/table_names/tanos_jlpt.dart
+++ b/lib/table_names/tanos_jlpt.dart
@@ -1,5 +1,6 @@
 abstract class TanosJLPTTableNames {
+  static const String version = 'JMdict_JLPT_Version';
  static const String jlptTag = 'JMdict_JLPTTag';

-  static Set<String> get allTables => {jlptTag};
+  static Set<String> get allTables => {version, jlptTag};
 }
--- a/lib/util/lemmatizer/lemmatizer.dart
+++ b/lib/util/lemmatizer/lemmatizer.dart
@@ -1,3 +1,4 @@
+import 'package:collection/collection.dart';
 import 'package:jadb/util/lemmatizer/rules.dart';

 enum WordClass {
@@ -10,6 +11,8 @@ enum WordClass {
  adverb,
  particle,
  input,
+
+  // TODO: add toString and fromString so it can be parsed by the cli
 }

 enum LemmatizationRuleType { prefix, suffix }
@@ -18,7 +21,7 @@ class LemmatizationRule {
  final String name;
  final AllomorphPattern pattern;
  final WordClass wordClass;
-  final List<WordClass>? validChildClasses;
+  final Set<WordClass>? validChildClasses;
  final bool terminal;

  const LemmatizationRule({
@@ -38,9 +41,9 @@ class LemmatizationRule {
    required String pattern,
    required String? replacement,
    required WordClass wordClass,
-    validChildClasses,
-    terminal = false,
-    lookAheadBehind = const [''],
+    Set<WordClass>? validChildClasses,
+    bool terminal = false,
+    List<Pattern> lookAheadBehind = const [''],
    LemmatizationRuleType type = LemmatizationRuleType.suffix,
  }) : this(
         name: name,
@@ -55,6 +58,27 @@ class LemmatizationRule {
         terminal: terminal,
         wordClass: wordClass,
       );
+
+  @override
+  int get hashCode => Object.hash(
+    name,
+    pattern,
+    wordClass,
+    validChildClasses,
+    terminal,
+    SetEquality().hash(validChildClasses),
+  );
+
+  @override
+  bool operator ==(Object other) {
+    if (identical(this, other)) return true;
+    return other is LemmatizationRule &&
+        other.name == name &&
+        other.pattern == pattern &&
+        other.wordClass == wordClass &&
+        other.terminal == terminal &&
+        SetEquality().equals(validChildClasses, other.validChildClasses);
+  }
 }

 /// Represents a set of patterns for matching allomorphs in a word.
@@ -71,6 +95,7 @@ class AllomorphPattern {
    this.lookAheadBehind = const [''],
  });

+  /// Convert the [patterns] into regexes
  List<(String, Pattern)> get allPatternCombinations {
    final combinations = <(String, Pattern)>[];
    for (final l in lookAheadBehind) {
@@ -94,6 +119,7 @@ class AllomorphPattern {
    return combinations;
  }

+  /// Check whether an input string matches any of the [patterns]
  bool matches(String word) {
    for (final (_, p) in allPatternCombinations) {
      if (p is String) {
@@ -111,6 +137,9 @@ class AllomorphPattern {
    return false;
  }

+  /// Apply the replacement for this pattern.
+  ///
+  /// If none of the [patterns] apply, this function returns `null`.
  List<String>? apply(String word) {
    for (final (affix, p) in allPatternCombinations) {
      switch ((type, p is RegExp)) {
@@ -157,6 +186,22 @@ class AllomorphPattern {
    }
    return null;
  }
+
+  @override
+  int get hashCode => Object.hash(
+    type,
+    ListEquality().hash(lookAheadBehind),
+    MapEquality().hash(patterns),
+  );
+
+  @override
+  bool operator ==(Object other) {
+    if (identical(this, other)) return true;
+    return other is AllomorphPattern &&
+        other.type == type &&
+        ListEquality().equals(other.lookAheadBehind, lookAheadBehind) &&
+        MapEquality().equals(other.patterns, patterns);
+  }
 }

 class Lemmatized {
@@ -203,9 +248,10 @@ List<Lemmatized> _lemmatize(LemmatizationRule parentRule, String word) {

  final filteredLemmatizationRules = parentRule.validChildClasses == null
      ? lemmatizationRules
-      : lemmatizationRules.where(
-          (r) => parentRule.validChildClasses!.contains(r.wordClass),
-        );
+      : [
+          for (final wordClass in parentRule.validChildClasses!)
+            ...lemmatizationRulesByWordClass[wordClass]!,
+        ];

  for (final rule in filteredLemmatizationRules) {
    if (rule.matches(word)) {
--- a/lib/util/lemmatizer/rules.dart
+++ b/lib/util/lemmatizer/rules.dart
@@ -1,10 +1,17 @@
 import 'package:jadb/util/lemmatizer/lemmatizer.dart';
-import 'package:jadb/util/lemmatizer/rules/godan-verbs.dart';
-import 'package:jadb/util/lemmatizer/rules/i-adjectives.dart';
-import 'package:jadb/util/lemmatizer/rules/ichidan-verbs.dart';
+import 'package:jadb/util/lemmatizer/rules/godan_verbs.dart';
+import 'package:jadb/util/lemmatizer/rules/i_adjectives.dart';
+import 'package:jadb/util/lemmatizer/rules/ichidan_verbs.dart';

-List<LemmatizationRule> lemmatizationRules = [
+final List<LemmatizationRule> lemmatizationRules = List.unmodifiable([
  ...ichidanVerbLemmatizationRules,
  ...godanVerbLemmatizationRules,
  ...iAdjectiveLemmatizationRules,
-];
+]);
+
+final Map<WordClass, List<LemmatizationRule>> lemmatizationRulesByWordClass =
+    Map.unmodifiable({
+      WordClass.ichidanVerb: ichidanVerbLemmatizationRules,
+      WordClass.iAdjective: iAdjectiveLemmatizationRules,
+      WordClass.godanVerb: godanVerbLemmatizationRules,
+    });
--- a/lib/util/lemmatizer/rules/godan-verbs.dart
+++ b/lib/util/lemmatizer/rules/godan-verbs.dart
@@ -1,457 +0,0 @@
-import 'package:jadb/util/lemmatizer/lemmatizer.dart';
-
-List<LemmatizationRule> godanVerbLemmatizationRules = [
-  LemmatizationRule(
-    name: 'Godan verb - base form',
-    terminal: true,
-    pattern: AllomorphPattern(
-      patterns: {
-        'う': ['う'],
-        'く': ['く'],
-        'ぐ': ['ぐ'],
-        'す': ['す'],
-        'つ': ['つ'],
-        'ぬ': ['ぬ'],
-        'ぶ': ['ぶ'],
-        'む': ['む'],
-        'る': ['る'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'わない': ['う'],
-        'かない': ['く'],
-        'がない': ['ぐ'],
-        'さない': ['す'],
-        'たない': ['つ'],
-        'なない': ['ぬ'],
-        'ばない': ['ぶ'],
-        'まない': ['む'],
-        'らない': ['る'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - past form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'した': ['す'],
-        'った': ['る', 'つ', 'う'],
-        'んだ': ['む', 'ぬ', 'ぶ'],
-        'いだ': ['ぐ'],
-        'いた': ['く'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - te-form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'いて': ['く', 'ぐ'],
-        'して': ['す'],
-        'って': ['る', 'つ', 'う'],
-        'んで': ['む', 'ぬ', 'ぶ'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - te-form with いる',
-    pattern: AllomorphPattern(
-      patterns: {
-        'いている': ['く', 'ぐ'],
-        'している': ['す'],
-        'っている': ['る', 'つ', 'う'],
-        'んでいる': ['む', 'ぬ', 'ぶ'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - te-form with いた',
-    pattern: AllomorphPattern(
-      patterns: {
-        'いていた': ['く', 'ぐ'],
-        'していた': ['す'],
-        'っていた': ['る', 'つ', 'う'],
-        'んでいた': ['む', 'ぬ', 'ぶ'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - conditional form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'けば': ['く'],
-        'げば': ['ぐ'],
-        'せば': ['す'],
-        'てば': ['つ', 'る', 'う'],
-        'ねば': ['ぬ'],
-        'べば': ['ぶ'],
-        'めば': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - volitional form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'おう': ['う'],
-        'こう': ['く'],
-        'ごう': ['ぐ'],
-        'そう': ['す'],
-        'とう': ['つ', 'る', 'う'],
-        'のう': ['ぬ'],
-        'ぼう': ['ぶ'],
-        'もう': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - potential form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'ける': ['く'],
-        'げる': ['ぐ'],
-        'せる': ['す'],
-        'てる': ['つ', 'る', 'う'],
-        'ねる': ['ぬ'],
-        'べる': ['ぶ'],
-        'める': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - passive form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'かれる': ['く'],
-        'がれる': ['ぐ'],
-        'される': ['す'],
-        'たれる': ['つ', 'る', 'う'],
-        'なれる': ['ぬ'],
-        'ばれる': ['ぶ'],
-        'まれる': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - causative form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'かせる': ['く'],
-        'がせる': ['ぐ'],
-        'させる': ['す'],
-        'たせる': ['つ', 'る', 'う'],
-        'なせる': ['ぬ'],
-        'ばせる': ['ぶ'],
-        'ませる': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - causative-passive form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'かされる': ['く'],
-        'がされる': ['ぐ'],
-        'される': ['す'],
-        'たされる': ['つ', 'る', 'う'],
-        'なされる': ['ぬ'],
-        'ばされる': ['ぶ'],
-        'まされる': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - imperative form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'え': ['う'],
-        'け': ['く'],
-        'げ': ['ぐ'],
-        'せ': ['す'],
-        'て': ['つ', 'る', 'う'],
-        'ね': ['ぬ'],
-        'べ': ['ぶ'],
-        'め': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative past form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'わなかった': ['う'],
-        'かなかった': ['く'],
-        'がなかった': ['ぐ'],
-        'さなかった': ['す'],
-        'たなかった': ['つ'],
-        'ななかった': ['ぬ'],
-        'ばなかった': ['ぶ'],
-        'まなかった': ['む'],
-        'らなかった': ['る'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative te-form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'わなくて': ['う'],
-        'かなくて': ['く'],
-        'がなくて': ['ぐ'],
-        'さなくて': ['す'],
-        'たなくて': ['つ'],
-        'ななくて': ['ぬ'],
-        'ばなくて': ['ぶ'],
-        'まなくて': ['む'],
-        'らなくて': ['る'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative conditional form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'わなければ': ['う'],
-        'かなければ': ['く'],
-        'がなければ': ['ぐ'],
-        'さなければ': ['す'],
-        'たなければ': ['つ'],
-        'ななければ': ['ぬ'],
-        'ばなければ': ['ぶ'],
-        'まなければ': ['む'],
-        'らなければ': ['る'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative volitional form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'うまい': ['う'],
-        'くまい': ['く'],
-        'ぐまい': ['ぐ'],
-        'すまい': ['す'],
-        'つまい': ['つ', 'る', 'う'],
-        'ぬまい': ['ぬ'],
-        'ぶまい': ['ぶ'],
-        'むまい': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative potential form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'けない': ['く'],
-        'げない': ['ぐ'],
-        'せない': ['す'],
-        'てない': ['つ', 'る', 'う'],
-        'ねない': ['ぬ'],
-        'べない': ['ぶ'],
-        'めない': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative passive form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'かれない': ['く'],
-        'がれない': ['ぐ'],
-        'されない': ['す'],
-        'たれない': ['つ', 'る', 'う'],
-        'なれない': ['ぬ'],
-        'ばれない': ['ぶ'],
-        'まれない': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative causative form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'かせない': ['く'],
-        'がせない': ['ぐ'],
-        'させない': ['す'],
-        'たせない': ['つ', 'る', 'う'],
-        'なせない': ['ぬ'],
-        'ばせない': ['ぶ'],
-        'ませない': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative causative-passive form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'かされない': ['く'],
-        'がされない': ['ぐ'],
-        'されない': ['す'],
-        'たされない': ['つ', 'る', 'う'],
-        'なされない': ['ぬ'],
-        'ばされない': ['ぶ'],
-        'まされない': ['む'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative imperative form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'うな': ['う'],
-        'くな': ['く'],
-        'ぐな': ['ぐ'],
-        'すな': ['す'],
-        'つな': ['つ'],
-        'ぬな': ['ぬ'],
-        'ぶな': ['ぶ'],
-        'むな': ['む'],
-        'るな': ['る'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - desire form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'きたい': ['く'],
-        'ぎたい': ['ぐ'],
-        'したい': ['す'],
-        'ちたい': ['つ'],
-        'にたい': ['ぬ'],
-        'びたい': ['ぶ'],
-        'みたい': ['む'],
-        'りたい': ['る'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative desire form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'いたくない': ['う'],
-        'きたくない': ['く'],
-        'ぎたくない': ['ぐ'],
-        'したくない': ['す'],
-        'ちたくない': ['つ'],
-        'にたくない': ['ぬ'],
-        'びたくない': ['ぶ'],
-        'みたくない': ['む'],
-        'りたくない': ['る'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - past desire form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'きたかった': ['く'],
-        'ぎたかった': ['ぐ'],
-        'したかった': ['す'],
-        'ちたかった': ['つ'],
-        'にたかった': ['ぬ'],
-        'びたかった': ['ぶ'],
-        'みたかった': ['む'],
-        'りたかった': ['る'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-  LemmatizationRule(
-    name: 'Godan verb - negative past desire form',
-    pattern: AllomorphPattern(
-      patterns: {
-        'いたくなかった': ['う'],
-        'きたくなかった': ['く'],
-        'ぎたくなかった': ['ぐ'],
-        'したくなかった': ['す'],
-        'ちたくなかった': ['つ'],
-        'にたくなかった': ['ぬ'],
-        'びたくなかった': ['ぶ'],
-        'みたくなかった': ['む'],
-        'りたくなかった': ['る'],
-      },
-      type: LemmatizationRuleType.suffix,
-    ),
-    validChildClasses: [WordClass.godanVerb],
-    wordClass: WordClass.godanVerb,
-  ),
-];
--- a/lib/util/lemmatizer/rules/godan_verbs.dart
+++ b/lib/util/lemmatizer/rules/godan_verbs.dart
@@ -0,0 +1,509 @@
+import 'package:jadb/util/lemmatizer/lemmatizer.dart';
+
+final LemmatizationRule godanVerbBase = LemmatizationRule(
+  name: 'Godan verb - base form',
+  terminal: true,
+  pattern: AllomorphPattern(
+    patterns: {
+      'う': ['う'],
+      'く': ['く'],
+      'ぐ': ['ぐ'],
+      'す': ['す'],
+      'つ': ['つ'],
+      'ぬ': ['ぬ'],
+      'ぶ': ['ぶ'],
+      'む': ['む'],
+      'る': ['る'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegative = LemmatizationRule(
+  name: 'Godan verb - negative form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'わない': ['う'],
+      'かない': ['く'],
+      'がない': ['ぐ'],
+      'さない': ['す'],
+      'たない': ['つ'],
+      'なない': ['ぬ'],
+      'ばない': ['ぶ'],
+      'まない': ['む'],
+      'らない': ['る'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbPast = LemmatizationRule(
+  name: 'Godan verb - past form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'した': ['す'],
+      'った': ['る', 'つ', 'う'],
+      'んだ': ['む', 'ぬ', 'ぶ'],
+      'いだ': ['ぐ'],
+      'いた': ['く'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbTe = LemmatizationRule(
+  name: 'Godan verb - te-form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'いて': ['く', 'ぐ'],
+      'して': ['す'],
+      'って': ['る', 'つ', 'う'],
+      'んで': ['む', 'ぬ', 'ぶ'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbTeiru = LemmatizationRule(
+  name: 'Godan verb - te-form with いる',
+  pattern: AllomorphPattern(
+    patterns: {
+      'いている': ['く', 'ぐ'],
+      'している': ['す'],
+      'っている': ['る', 'つ', 'う'],
+      'んでいる': ['む', 'ぬ', 'ぶ'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbTeita = LemmatizationRule(
+  name: 'Godan verb - te-form with いた',
+  pattern: AllomorphPattern(
+    patterns: {
+      'いていた': ['く', 'ぐ'],
+      'していた': ['す'],
+      'っていた': ['る', 'つ', 'う'],
+      'んでいた': ['む', 'ぬ', 'ぶ'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbConditional = LemmatizationRule(
+  name: 'Godan verb - conditional form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'けば': ['く'],
+      'げば': ['ぐ'],
+      'せば': ['す'],
+      'てば': ['つ', 'る', 'う'],
+      'ねば': ['ぬ'],
+      'べば': ['ぶ'],
+      'めば': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbVolitional = LemmatizationRule(
+  name: 'Godan verb - volitional form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'おう': ['う'],
+      'こう': ['く'],
+      'ごう': ['ぐ'],
+      'そう': ['す'],
+      'とう': ['つ', 'る', 'う'],
+      'のう': ['ぬ'],
+      'ぼう': ['ぶ'],
+      'もう': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbPotential = LemmatizationRule(
+  name: 'Godan verb - potential form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'ける': ['く'],
+      'げる': ['ぐ'],
+      'せる': ['す'],
+      'てる': ['つ', 'る', 'う'],
+      'ねる': ['ぬ'],
+      'べる': ['ぶ'],
+      'める': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbPassive = LemmatizationRule(
+  name: 'Godan verb - passive form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'かれる': ['く'],
+      'がれる': ['ぐ'],
+      'される': ['す'],
+      'たれる': ['つ', 'る', 'う'],
+      'なれる': ['ぬ'],
+      'ばれる': ['ぶ'],
+      'まれる': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbCausative = LemmatizationRule(
+  name: 'Godan verb - causative form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'かせる': ['く'],
+      'がせる': ['ぐ'],
+      'させる': ['す'],
+      'たせる': ['つ', 'る', 'う'],
+      'なせる': ['ぬ'],
+      'ばせる': ['ぶ'],
+      'ませる': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbCausativePassive = LemmatizationRule(
+  name: 'Godan verb - causative-passive form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'かされる': ['く'],
+      'がされる': ['ぐ'],
+      'される': ['す'],
+      'たされる': ['つ', 'る', 'う'],
+      'なされる': ['ぬ'],
+      'ばされる': ['ぶ'],
+      'まされる': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbImperative = LemmatizationRule(
+  name: 'Godan verb - imperative form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'え': ['う'],
+      'け': ['く'],
+      'げ': ['ぐ'],
+      'せ': ['す'],
+      'て': ['つ', 'る', 'う'],
+      'ね': ['ぬ'],
+      'べ': ['ぶ'],
+      'め': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegativePast = LemmatizationRule(
+  name: 'Godan verb - negative past form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'わなかった': ['う'],
+      'かなかった': ['く'],
+      'がなかった': ['ぐ'],
+      'さなかった': ['す'],
+      'たなかった': ['つ'],
+      'ななかった': ['ぬ'],
+      'ばなかった': ['ぶ'],
+      'まなかった': ['む'],
+      'らなかった': ['る'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegativeTe = LemmatizationRule(
+  name: 'Godan verb - negative te-form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'わなくて': ['う'],
+      'かなくて': ['く'],
+      'がなくて': ['ぐ'],
+      'さなくて': ['す'],
+      'たなくて': ['つ'],
+      'ななくて': ['ぬ'],
+      'ばなくて': ['ぶ'],
+      'まなくて': ['む'],
+      'らなくて': ['る'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegativeConditional = LemmatizationRule(
+  name: 'Godan verb - negative conditional form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'わなければ': ['う'],
+      'かなければ': ['く'],
+      'がなければ': ['ぐ'],
+      'さなければ': ['す'],
+      'たなければ': ['つ'],
+      'ななければ': ['ぬ'],
+      'ばなければ': ['ぶ'],
+      'まなければ': ['む'],
+      'らなければ': ['る'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegativeVolitional = LemmatizationRule(
+  name: 'Godan verb - negative volitional form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'うまい': ['う'],
+      'くまい': ['く'],
+      'ぐまい': ['ぐ'],
+      'すまい': ['す'],
+      'つまい': ['つ', 'る', 'う'],
+      'ぬまい': ['ぬ'],
+      'ぶまい': ['ぶ'],
+      'むまい': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegativePotential = LemmatizationRule(
+  name: 'Godan verb - negative potential form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'けない': ['く'],
+      'げない': ['ぐ'],
+      'せない': ['す'],
+      'てない': ['つ', 'る', 'う'],
+      'ねない': ['ぬ'],
+      'べない': ['ぶ'],
+      'めない': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegativePassive = LemmatizationRule(
+  name: 'Godan verb - negative passive form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'かれない': ['く'],
+      'がれない': ['ぐ'],
+      'されない': ['す'],
+      'たれない': ['つ', 'る', 'う'],
+      'なれない': ['ぬ'],
+      'ばれない': ['ぶ'],
+      'まれない': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegativeCausative = LemmatizationRule(
+  name: 'Godan verb - negative causative form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'かせない': ['く'],
+      'がせない': ['ぐ'],
+      'させない': ['す'],
+      'たせない': ['つ', 'る', 'う'],
+      'なせない': ['ぬ'],
+      'ばせない': ['ぶ'],
+      'ませない': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegativeCausativePassive = LemmatizationRule(
+  name: 'Godan verb - negative causative-passive form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'かされない': ['く'],
+      'がされない': ['ぐ'],
+      'されない': ['す'],
+      'たされない': ['つ', 'る', 'う'],
+      'なされない': ['ぬ'],
+      'ばされない': ['ぶ'],
+      'まされない': ['む'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegativeImperative = LemmatizationRule(
+  name: 'Godan verb - negative imperative form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'うな': ['う'],
+      'くな': ['く'],
+      'ぐな': ['ぐ'],
+      'すな': ['す'],
+      'つな': ['つ'],
+      'ぬな': ['ぬ'],
+      'ぶな': ['ぶ'],
+      'むな': ['む'],
+      'るな': ['る'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbDesire = LemmatizationRule(
+  name: 'Godan verb - desire form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'きたい': ['く'],
+      'ぎたい': ['ぐ'],
+      'したい': ['す'],
+      'ちたい': ['つ'],
+      'にたい': ['ぬ'],
+      'びたい': ['ぶ'],
+      'みたい': ['む'],
+      'りたい': ['る'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegativeDesire = LemmatizationRule(
+  name: 'Godan verb - negative desire form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'いたくない': ['う'],
+      'きたくない': ['く'],
+      'ぎたくない': ['ぐ'],
+      'したくない': ['す'],
+      'ちたくない': ['つ'],
+      'にたくない': ['ぬ'],
+      'びたくない': ['ぶ'],
+      'みたくない': ['む'],
+      'りたくない': ['る'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbPastDesire = LemmatizationRule(
+  name: 'Godan verb - past desire form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'きたかった': ['く'],
+      'ぎたかった': ['ぐ'],
+      'したかった': ['す'],
+      'ちたかった': ['つ'],
+      'にたかった': ['ぬ'],
+      'びたかった': ['ぶ'],
+      'みたかった': ['む'],
+      'りたかった': ['る'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final LemmatizationRule godanVerbNegativePastDesire = LemmatizationRule(
+  name: 'Godan verb - negative past desire form',
+  pattern: AllomorphPattern(
+    patterns: {
+      'いたくなかった': ['う'],
+      'きたくなかった': ['く'],
+      'ぎたくなかった': ['ぐ'],
+      'したくなかった': ['す'],
+      'ちたくなかった': ['つ'],
+      'にたくなかった': ['ぬ'],
+      'びたくなかった': ['ぶ'],
+      'みたくなかった': ['む'],
+      'りたくなかった': ['る'],
+    },
+    type: LemmatizationRuleType.suffix,
+  ),
+  validChildClasses: {WordClass.godanVerb},
+  wordClass: WordClass.godanVerb,
+);
+
+final List<LemmatizationRule> godanVerbLemmatizationRules = List.unmodifiable([
+  godanVerbBase,
+  godanVerbNegative,
+  godanVerbPast,
+  godanVerbTe,
+  godanVerbTeiru,
+  godanVerbTeita,
+  godanVerbConditional,
+  godanVerbVolitional,
+  godanVerbPotential,
+  godanVerbPassive,
+  godanVerbCausative,
+  godanVerbCausativePassive,
+  godanVerbImperative,
+  godanVerbNegativePast,
+  godanVerbNegativeTe,
+  godanVerbNegativeConditional,
+  godanVerbNegativeVolitional,
+  godanVerbNegativePotential,
+  godanVerbNegativePassive,
+  godanVerbNegativeCausative,
+  godanVerbNegativeCausativePassive,
+  godanVerbNegativeImperative,
+  godanVerbDesire,
+  godanVerbNegativeDesire,
+  godanVerbPastDesire,
+  godanVerbNegativePastDesire,
+]);
--- a/lib/util/lemmatizer/rules/i-adjectives.dart
+++ b/lib/util/lemmatizer/rules/i-adjectives.dart
@@ -1,61 +0,0 @@
-import 'package:jadb/util/lemmatizer/lemmatizer.dart';
-
-List<LemmatizationRule> iAdjectiveLemmatizationRules = [
-  LemmatizationRule.simple(
-    name: 'I adjective - base form',
-    terminal: true,
-    pattern: 'い',
-    replacement: 'い',
-    validChildClasses: [WordClass.iAdjective],
-    wordClass: WordClass.iAdjective,
-  ),
-  LemmatizationRule.simple(
-    name: 'I adjective - negative form',
-    pattern: 'くない',
-    replacement: 'い',
-    validChildClasses: [WordClass.iAdjective],
-    wordClass: WordClass.iAdjective,
-  ),
-  LemmatizationRule.simple(
-    name: 'I adjective - past form',
-    pattern: 'かった',
-    replacement: 'い',
-    validChildClasses: [WordClass.iAdjective],
-    wordClass: WordClass.iAdjective,
-  ),
-  LemmatizationRule.simple(
-    name: 'I adjective - negative past form',
-    pattern: 'くなかった',
-    replacement: 'い',
-    validChildClasses: [WordClass.iAdjective],
-    wordClass: WordClass.iAdjective,
-  ),
-  LemmatizationRule.simple(
-    name: 'I adjective - te-form',
-    pattern: 'くて',
-    replacement: 'い',
-    validChildClasses: [WordClass.iAdjective],
-    wordClass: WordClass.iAdjective,
-  ),
-  LemmatizationRule.simple(
-    name: 'I adjective - conditional form',
-    pattern: 'ければ',
-    replacement: 'い',
-    validChildClasses: [WordClass.iAdjective],
-    wordClass: WordClass.iAdjective,
-  ),
-  LemmatizationRule.simple(
-    name: 'I adjective - volitional form',
-    pattern: 'かろう',
-    replacement: 'い',
-    validChildClasses: [WordClass.iAdjective],
-    wordClass: WordClass.iAdjective,
-  ),
-  LemmatizationRule.simple(
-    name: 'I adjective - continuative form',
-    pattern: 'く',
-    replacement: 'い',
-    validChildClasses: [WordClass.iAdjective],
-    wordClass: WordClass.iAdjective,
-  ),
-];
--- a/lib/util/lemmatizer/rules/i_adjectives.dart
+++ b/lib/util/lemmatizer/rules/i_adjectives.dart
@@ -0,0 +1,77 @@
+import 'package:jadb/util/lemmatizer/lemmatizer.dart';
+
+final LemmatizationRule iAdjectiveBase = LemmatizationRule.simple(
+  name: 'I adjective - base form',
+  terminal: true,
+  pattern: 'い',
+  replacement: 'い',
+  validChildClasses: {WordClass.iAdjective},
+  wordClass: WordClass.iAdjective,
+);
+
+final LemmatizationRule iAdjectiveNegative = LemmatizationRule.simple(
+  name: 'I adjective - negative form',
+  pattern: 'くない',
+  replacement: 'い',
+  validChildClasses: {WordClass.iAdjective},
+  wordClass: WordClass.iAdjective,
+);
+
+final LemmatizationRule iAdjectivePast = LemmatizationRule.simple(
+  name: 'I adjective - past form',
+  pattern: 'かった',
+  replacement: 'い',
+  validChildClasses: {WordClass.iAdjective},
+  wordClass: WordClass.iAdjective,
+);
+
+final LemmatizationRule iAdjectiveNegativePast = LemmatizationRule.simple(
+  name: 'I adjective - negative past form',
+  pattern: 'くなかった',
+  replacement: 'い',
+  validChildClasses: {WordClass.iAdjective},
+  wordClass: WordClass.iAdjective,
+);
+
+final LemmatizationRule iAdjectiveTe = LemmatizationRule.simple(
+  name: 'I adjective - te-form',
+  pattern: 'くて',
+  replacement: 'い',
+  validChildClasses: {WordClass.iAdjective},
+  wordClass: WordClass.iAdjective,
+);
+
+final LemmatizationRule iAdjectiveConditional = LemmatizationRule.simple(
+  name: 'I adjective - conditional form',
+  pattern: 'ければ',
+  replacement: 'い',
+  validChildClasses: {WordClass.iAdjective},
+  wordClass: WordClass.iAdjective,
+);
+
+final LemmatizationRule iAdjectiveVolitional = LemmatizationRule.simple(
+  name: 'I adjective - volitional form',
+  pattern: 'かろう',
+  replacement: 'い',
+  validChildClasses: {WordClass.iAdjective},
+  wordClass: WordClass.iAdjective,
+);
+
+final LemmatizationRule iAdjectiveContinuative = LemmatizationRule.simple(
+  name: 'I adjective - continuative form',
+  pattern: 'く',
+  replacement: 'い',
+  validChildClasses: {WordClass.iAdjective},
+  wordClass: WordClass.iAdjective,
+);
+
+final List<LemmatizationRule> iAdjectiveLemmatizationRules = List.unmodifiable([
+  iAdjectiveBase,
+  iAdjectiveNegative,
+  iAdjectivePast,
+  iAdjectiveNegativePast,
+  iAdjectiveTe,
+  iAdjectiveConditional,
+  iAdjectiveVolitional,
+  iAdjectiveContinuative,
+]);
--- a/lib/util/lemmatizer/rules/ichidan-verbs.dart
+++ b/lib/util/lemmatizer/rules/ichidan-verbs.dart
@@ -1,241 +0,0 @@
-import 'package:jadb/util/lemmatizer/lemmatizer.dart';
-import 'package:jadb/util/text_filtering.dart';
-
-List<Pattern> lookBehinds = [
-  kanjiRegex,
-  'き',
-  'ぎ',
-  'し',
-  'じ',
-  'ち',
-  'ぢ',
-  'に',
-  'ひ',
-  'び',
-  'び',
-  'み',
-  'り',
-  'け',
-  'げ',
-  'せ',
-  'ぜ',
-  'て',
-  'で',
-  'ね',
-  'へ',
-  'べ',
-  'め',
-  'れ',
-];
-
-List<LemmatizationRule> ichidanVerbLemmatizationRules = [
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - base form',
-    terminal: true,
-    pattern: 'る',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative form',
-    pattern: 'ない',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - past form',
-    pattern: 'た',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - te-form',
-    pattern: 'て',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - te-form with いる',
-    pattern: 'ている',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - te-form with いた',
-    pattern: 'ていた',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - conditional form',
-    pattern: 'れば',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - volitional form',
-    pattern: 'よう',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - potential form',
-    pattern: 'られる',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - passive form',
-    pattern: 'られる',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - causative form',
-    pattern: 'させる',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - causative passive form',
-    pattern: 'させられる',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - imperative form',
-    pattern: 'れ',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative past form',
-    pattern: 'なかった',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative te-form',
-    pattern: 'なくて',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative conditional form',
-    pattern: 'なければ',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative volitional form',
-    pattern: 'なかろう',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative potential form',
-    pattern: 'られない',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative passive form',
-    pattern: 'られない',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative causative form',
-    pattern: 'させない',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative causative passive form',
-    pattern: 'させられない',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative imperative form',
-    pattern: 'るな',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - desire form',
-    pattern: 'たい',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative desire form',
-    pattern: 'たくない',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - past desire form',
-    pattern: 'たかった',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-  LemmatizationRule.simple(
-    name: 'Ichidan verb - negative past desire form',
-    pattern: 'たくなかった',
-    replacement: 'る',
-    lookAheadBehind: lookBehinds,
-    validChildClasses: [WordClass.ichidanVerb],
-    wordClass: WordClass.ichidanVerb,
-  ),
-];
--- a/lib/util/lemmatizer/rules/ichidan_verbs.dart
+++ b/lib/util/lemmatizer/rules/ichidan_verbs.dart
@@ -0,0 +1,331 @@
+import 'package:jadb/util/lemmatizer/lemmatizer.dart';
+import 'package:jadb/util/text_filtering.dart';
+
+final List<Pattern> _lookBehinds = [
+  kanjiRegex,
+  'き',
+  'ぎ',
+  'し',
+  'じ',
+  'ち',
+  'ぢ',
+  'に',
+  'ひ',
+  'び',
+  'び',
+  'み',
+  'り',
+  'け',
+  'げ',
+  'せ',
+  'ぜ',
+  'て',
+  'で',
+  'ね',
+  'へ',
+  'べ',
+  'め',
+  'れ',
+];
+
+final LemmatizationRule ichidanVerbBase = LemmatizationRule.simple(
+  name: 'Ichidan verb - base form',
+  terminal: true,
+  pattern: 'る',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbNegative = LemmatizationRule.simple(
+  name: 'Ichidan verb - negative form',
+  pattern: 'ない',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+final LemmatizationRule ichidanVerbPast = LemmatizationRule.simple(
+  name: 'Ichidan verb - past form',
+  pattern: 'た',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbTe = LemmatizationRule.simple(
+  name: 'Ichidan verb - te-form',
+  pattern: 'て',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbTeiru = LemmatizationRule.simple(
+  name: 'Ichidan verb - te-form with いる',
+  pattern: 'ている',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbTeita = LemmatizationRule.simple(
+  name: 'Ichidan verb - te-form with いた',
+  pattern: 'ていた',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbConditional = LemmatizationRule.simple(
+  name: 'Ichidan verb - conditional form',
+  pattern: 'れば',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbVolitional = LemmatizationRule.simple(
+  name: 'Ichidan verb - volitional form',
+  pattern: 'よう',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbPotential = LemmatizationRule.simple(
+  name: 'Ichidan verb - potential form',
+  pattern: 'られる',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbPassive = LemmatizationRule.simple(
+  name: 'Ichidan verb - passive form',
+  pattern: 'られる',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbCausative = LemmatizationRule.simple(
+  name: 'Ichidan verb - causative form',
+  pattern: 'させる',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbCausativePassive = LemmatizationRule.simple(
+  name: 'Ichidan verb - causative passive form',
+  pattern: 'させられる',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbImperative = LemmatizationRule.simple(
+  name: 'Ichidan verb - imperative form',
+  pattern: 'れ',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbNegativePast = LemmatizationRule.simple(
+  name: 'Ichidan verb - negative past form',
+  pattern: 'なかった',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbNegativeTe = LemmatizationRule.simple(
+  name: 'Ichidan verb - negative te-form',
+  pattern: 'なくて',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbNegativeConditional =
+    LemmatizationRule.simple(
+      name: 'Ichidan verb - negative conditional form',
+      pattern: 'なければ',
+      replacement: 'る',
+      lookAheadBehind: _lookBehinds,
+      validChildClasses: {WordClass.ichidanVerb},
+      wordClass: WordClass.ichidanVerb,
+    );
+
+final LemmatizationRule ichidanVerbNegativeConditionalVariant1 =
+    LemmatizationRule.simple(
+      name: 'Ichidan verb - negative conditional form (informal variant)',
+      pattern: 'なきゃ',
+      replacement: 'る',
+      lookAheadBehind: _lookBehinds,
+      validChildClasses: {WordClass.ichidanVerb},
+      wordClass: WordClass.ichidanVerb,
+    );
+
+final LemmatizationRule ichidanVerbNegativeConditionalVariant2 =
+    LemmatizationRule.simple(
+      name: 'Ichidan verb - negative conditional form (informal variant)',
+      pattern: 'なくちゃ',
+      replacement: 'る',
+      lookAheadBehind: _lookBehinds,
+      validChildClasses: {WordClass.ichidanVerb},
+      wordClass: WordClass.ichidanVerb,
+    );
+
+final LemmatizationRule ichidanVerbNegativeConditionalVariant3 =
+    LemmatizationRule.simple(
+      name: 'Ichidan verb - negative conditional form (informal variant)',
+      pattern: 'ないと',
+      replacement: 'る',
+      lookAheadBehind: _lookBehinds,
+      validChildClasses: {WordClass.ichidanVerb},
+      wordClass: WordClass.ichidanVerb,
+    );
+
+final LemmatizationRule ichidanVerbNegativeVolitional =
+    LemmatizationRule.simple(
+      name: 'Ichidan verb - negative volitional form',
+      pattern: 'なかろう',
+      replacement: 'る',
+      lookAheadBehind: _lookBehinds,
+      validChildClasses: {WordClass.ichidanVerb},
+      wordClass: WordClass.ichidanVerb,
+    );
+
+final LemmatizationRule ichidanVerbNegativePotential = LemmatizationRule.simple(
+  name: 'Ichidan verb - negative potential form',
+  pattern: 'られない',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbNegativePassive = LemmatizationRule.simple(
+  name: 'Ichidan verb - negative passive form',
+  pattern: 'られない',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbNegativeCausative = LemmatizationRule.simple(
+  name: 'Ichidan verb - negative causative form',
+  pattern: 'させない',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbNegativeCausativePassive =
+    LemmatizationRule.simple(
+      name: 'Ichidan verb - negative causative passive form',
+      pattern: 'させられない',
+      replacement: 'る',
+      lookAheadBehind: _lookBehinds,
+      validChildClasses: {WordClass.ichidanVerb},
+      wordClass: WordClass.ichidanVerb,
+    );
+
+final LemmatizationRule ichidanVerbNegativeImperative =
+    LemmatizationRule.simple(
+      name: 'Ichidan verb - negative imperative form',
+      pattern: 'るな',
+      replacement: 'る',
+      lookAheadBehind: _lookBehinds,
+      validChildClasses: {WordClass.ichidanVerb},
+      wordClass: WordClass.ichidanVerb,
+    );
+
+final LemmatizationRule ichidanVerbDesire = LemmatizationRule.simple(
+  name: 'Ichidan verb - desire form',
+  pattern: 'たい',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbNegativeDesire = LemmatizationRule.simple(
+  name: 'Ichidan verb - negative desire form',
+  pattern: 'たくない',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbPastDesire = LemmatizationRule.simple(
+  name: 'Ichidan verb - past desire form',
+  pattern: 'たかった',
+  replacement: 'る',
+  lookAheadBehind: _lookBehinds,
+  validChildClasses: {WordClass.ichidanVerb},
+  wordClass: WordClass.ichidanVerb,
+);
+
+final LemmatizationRule ichidanVerbNegativePastDesire =
+    LemmatizationRule.simple(
+      name: 'Ichidan verb - negative past desire form',
+      pattern: 'たくなかった',
+      replacement: 'る',
+      lookAheadBehind: _lookBehinds,
+      validChildClasses: {WordClass.ichidanVerb},
+      wordClass: WordClass.ichidanVerb,
+    );
+
+final List<LemmatizationRule> ichidanVerbLemmatizationRules =
+    List.unmodifiable([
+      ichidanVerbBase,
+      ichidanVerbNegative,
+      ichidanVerbPast,
+      ichidanVerbTe,
+      ichidanVerbTeiru,
+      ichidanVerbTeita,
+      ichidanVerbConditional,
+      ichidanVerbVolitional,
+      ichidanVerbPotential,
+      ichidanVerbPassive,
+      ichidanVerbCausative,
+      ichidanVerbCausativePassive,
+      ichidanVerbImperative,
+      ichidanVerbNegativePast,
+      ichidanVerbNegativeTe,
+      ichidanVerbNegativeConditional,
+      ichidanVerbNegativeConditionalVariant1,
+      ichidanVerbNegativeConditionalVariant2,
+      ichidanVerbNegativeConditionalVariant3,
+      ichidanVerbNegativeVolitional,
+      ichidanVerbNegativePotential,
+      ichidanVerbNegativePassive,
+      ichidanVerbNegativeCausative,
+      ichidanVerbNegativeCausativePassive,
+      ichidanVerbNegativeImperative,
+      ichidanVerbDesire,
+      ichidanVerbNegativeDesire,
+      ichidanVerbPastDesire,
+      ichidanVerbNegativePastDesire,
+    ]);
--- a/lib/util/romaji_transliteration.dart
+++ b/lib/util/romaji_transliteration.dart
@@ -1,9 +1,9 @@
 // Source: https://github.com/Kimtaro/ve/blob/master/lib/providers/japanese_transliterators.rb

-const hiragana_syllabic_n = 'ん';
-const hiragana_small_tsu = 'っ';
+const hiraganaSyllabicN = 'ん';
+const hiraganaSmallTsu = 'っ';

-const Map<String, String> hiragana_to_latin = {
+const Map<String, String> hiraganaToLatin = {
  'あ': 'a',
  'い': 'i',
  'う': 'u',
@@ -209,7 +209,7 @@ const Map<String, String> hiragana_to_latin = {
  'ゟ': 'yori',
 };

-const Map<String, String> latin_to_hiragana = {
+const Map<String, String> latinToHiragana = {
  'a': 'あ',
  'i': 'い',
  'u': 'う',
@@ -481,12 +481,13 @@ const Map<String, String> latin_to_hiragana = {
  '#~': '〜',
 };

-bool _smallTsu(String forConversion) => forConversion == hiragana_small_tsu;
+bool _smallTsu(String forConversion) => forConversion == hiraganaSmallTsu;
 bool _nFollowedByYuYeYo(String forConversion, String kana) =>
-    forConversion == hiragana_syllabic_n &&
+    forConversion == hiraganaSyllabicN &&
    kana.length > 1 &&
    'やゆよ'.contains(kana.substring(1, 2));

+/// Transliterates a string of hiragana characters to Latin script (romaji).
 String transliterateHiraganaToLatin(String hiragana) {
  String kana = hiragana;
  String romaji = '';
@@ -505,7 +506,7 @@ String transliterateHiraganaToLatin(String hiragana) {
      } else if (_nFollowedByYuYeYo(forConversion, kana)) {
        mora = "n'";
      }
-      mora ??= hiragana_to_latin[forConversion];
+      mora ??= hiraganaToLatin[forConversion];

      if (mora != null) {
        if (geminate) {
@@ -524,15 +525,61 @@ String transliterateHiraganaToLatin(String hiragana) {
  return romaji;
 }

+/// Returns a list of pairs of indices into the input and output strings,
+/// indicating which characters in the input string correspond to which characters in the output string.
+List<(int, int)> transliterateHiraganaToLatinSpan(String hiragana) {
+  String kana = hiragana;
+  String romaji = '';
+  final List<(int, int)> spans = [];
+  bool geminate = false;
+  int kanaIndex = 0;
+
+  while (kana.isNotEmpty) {
+    final lengths = [if (kana.length > 1) 2, 1];
+    for (final length in lengths) {
+      final String forConversion = kana.substring(0, length);
+      String? mora;
+
+      if (_smallTsu(forConversion)) {
+        geminate = true;
+        kana = kana.replaceRange(0, length, '');
+        break;
+      } else if (_nFollowedByYuYeYo(forConversion, kana)) {
+        mora = "n'";
+      }
+      mora ??= hiraganaToLatin[forConversion];
+
+      if (mora != null) {
+        if (geminate) {
+          geminate = false;
+          romaji += mora.substring(0, 1);
+        }
+        spans.add((kanaIndex, romaji.length));
+        romaji += mora;
+        kana = kana.replaceRange(0, length, '');
+        kanaIndex += length;
+        break;
+      } else if (length == 1) {
+        spans.add((kanaIndex, romaji.length));
+        romaji += forConversion;
+        kana = kana.replaceRange(0, length, '');
+        kanaIndex += length;
+      }
+    }
+  }
+  return spans;
+}
+
 bool _doubleNFollowedByAIUEO(String forConversion) =>
    RegExp(r'^nn[aiueo]$').hasMatch(forConversion);
 bool _hasTableMatch(String forConversion) =>
-    latin_to_hiragana[forConversion] != null;
+    latinToHiragana[forConversion] != null;
 bool _hasDoubleConsonant(String forConversion, int length) =>
    forConversion == 'tch' ||
    (length == 2 &&
        RegExp(r'^([kgsztdnbpmyrlwchf])\1$').hasMatch(forConversion));

+/// Transliterates a string of Latin script (romaji) to hiragana characters.
 String transliterateLatinToHiragana(String latin) {
  String romaji = latin
      .toLowerCase()
@@ -549,12 +596,12 @@ String transliterateLatinToHiragana(String latin) {
      final String forConversion = romaji.substring(0, length);

      if (_doubleNFollowedByAIUEO(forConversion)) {
-        mora = hiragana_syllabic_n;
+        mora = hiraganaSyllabicN;
        forRemoval = 1;
      } else if (_hasTableMatch(forConversion)) {
-        mora = latin_to_hiragana[forConversion];
+        mora = latinToHiragana[forConversion];
      } else if (_hasDoubleConsonant(forConversion, length)) {
-        mora = hiragana_small_tsu;
+        mora = hiraganaSmallTsu;
        forRemoval = 1;
      }

@@ -572,6 +619,53 @@ String transliterateLatinToHiragana(String latin) {
  return kana;
 }

+/// Returns a list of pairs of indices into the input and output strings,
+/// indicating which characters in the input string correspond to which characters in the output string.
+List<(int, int)> transliterateLatinToHiraganaSpan(String latin) {
+  String romaji = latin
+      .toLowerCase()
+      .replaceAll('mb', 'nb')
+      .replaceAll('mp', 'np');
+  String kana = '';
+  final List<(int, int)> spans = [];
+  int latinIndex = 0;
+
+  while (romaji.isNotEmpty) {
+    final lengths = [if (romaji.length > 2) 3, if (romaji.length > 1) 2, 1];
+
+    for (final length in lengths) {
+      String? mora;
+      int forRemoval = length;
+      final String forConversion = romaji.substring(0, length);
+
+      if (_doubleNFollowedByAIUEO(forConversion)) {
+        mora = hiraganaSyllabicN;
+        forRemoval = 1;
+      } else if (_hasTableMatch(forConversion)) {
+        mora = latinToHiragana[forConversion];
+      } else if (_hasDoubleConsonant(forConversion, length)) {
+        mora = hiraganaSmallTsu;
+        forRemoval = 1;
+      }
+
+      if (mora != null) {
+        spans.add((latinIndex, kana.length));
+        kana += mora;
+        romaji = romaji.replaceRange(0, forRemoval, '');
+        latinIndex += forRemoval;
+        break;
+      } else if (length == 1) {
+        spans.add((latinIndex, kana.length));
+        kana += forConversion;
+        romaji = romaji.replaceRange(0, 1, '');
+        latinIndex += 1;
+      }
+    }
+  }
+
+  return spans;
+}
+
 String _transposeCodepointsInRange(
  String text,
  int distance,
@@ -583,15 +677,19 @@ String _transposeCodepointsInRange(
  ),
 );

+/// Transliterates a string of kana characters (hiragana or katakana) to Latin script (romaji).
 String transliterateKanaToLatin(String kana) =>
    transliterateHiraganaToLatin(transliterateKatakanaToHiragana(kana));

+/// Transliterates a string of Latin script (romaji) to katakana characters.
 String transliterateLatinToKatakana(String latin) =>
    transliterateHiraganaToKatakana(transliterateLatinToHiragana(latin));

+/// Transliterates a string of katakana characters to hiragana characters.
 String transliterateKatakanaToHiragana(String katakana) =>
    _transposeCodepointsInRange(katakana, -96, 12449, 12534);

+/// Transliterates a string of hiragana characters to katakana characters.
 String transliterateHiraganaToKatakana(String hiragana) =>
    _transposeCodepointsInRange(hiragana, 96, 12353, 12438);

--- a/migrations/0001_JMDict.sql
+++ b/migrations/0001_JMDict.sql
@@ -1,3 +1,16 @@
+CREATE TABLE "JMdict_Version" (
+  "version" VARCHAR(10) PRIMARY KEY NOT NULL,
+  "date" DATE NOT NULL,
+  "hash" VARCHAR(64) NOT NULL
+) WITHOUT ROWID;
+
+CREATE TRIGGER "JMdict_Version_SingleRow"
+BEFORE INSERT ON "JMdict_Version"
+WHEN (SELECT COUNT(*) FROM "JMdict_Version") >= 1
+BEGIN
+    SELECT RAISE(FAIL, 'Only one row allowed in JMdict_Version');
+END;
+
 CREATE TABLE "JMdict_InfoDialect" (
  "id" VARCHAR(4) PRIMARY KEY NOT NULL,
  "description" TEXT NOT NULL
--- a/migrations/0004_JMDict_tanos_jlpt_tags.sql
+++ b/migrations/0004_JMDict_tanos_jlpt_tags.sql
@@ -1,3 +1,16 @@
+CREATE TABLE "JMdict_JLPT_Version" (
+  "version" VARCHAR(10) PRIMARY KEY NOT NULL,
+  "date" DATE NOT NULL,
+  "hash" VARCHAR(64) NOT NULL
+) WITHOUT ROWID;
+
+CREATE TRIGGER "JMdict_JLPT_Version_SingleRow"
+BEFORE INSERT ON "JMdict_JLPT_Version"
+WHEN (SELECT COUNT(*) FROM "JMdict_JLPT_Version") >= 1
+BEGIN
+    SELECT RAISE(FAIL, 'Only one row allowed in JMdict_JLPT_Version');
+END;
+
 CREATE TABLE "JMdict_JLPTTag" (
  "entryId" INTEGER NOT NULL,
  "jlptLevel" CHAR(2) NOT NULL CHECK ("jlptLevel" in ('N5', 'N4', 'N3', 'N2', 'N1')),
--- a/migrations/0006_RADKFILE.sql
+++ b/migrations/0006_RADKFILE.sql
@@ -1,3 +1,16 @@
+CREATE TABLE "RADKFILE_Version" (
+  "version" VARCHAR(10) PRIMARY KEY NOT NULL,
+  "date" DATE NOT NULL,
+  "hash" VARCHAR(64) NOT NULL
+) WITHOUT ROWID;
+
+CREATE TRIGGER "RADKFILE_Version_SingleRow"
+BEFORE INSERT ON "RADKFILE_Version"
+WHEN (SELECT COUNT(*) FROM "RADKFILE_Version") >= 1
+BEGIN
+    SELECT RAISE(FAIL, 'Only one row allowed in RADKFILE_Version');
+END;
+
 CREATE TABLE "RADKFILE" (
  "kanji" CHAR(1) NOT NULL,
  "radical" CHAR(1) NOT NULL,
--- a/migrations/0007_KANJIDIC2.sql
+++ b/migrations/0007_KANJIDIC2.sql
@@ -1,3 +1,16 @@
+CREATE TABLE "KANJIDIC_Version" (
+  "version" VARCHAR(10) PRIMARY KEY NOT NULL,
+  "date" DATE NOT NULL,
+  "hash" VARCHAR(64) NOT NULL
+) WITHOUT ROWID;
+
+CREATE TRIGGER "KANJIDIC_Version_SingleRow"
+BEFORE INSERT ON "KANJIDIC_Version"
+WHEN (SELECT COUNT(*) FROM "KANJIDIC_Version") >= 1
+BEGIN
+    SELECT RAISE(FAIL, 'Only one row allowed in KANJIDIC_Version');
+END;
+
 CREATE TABLE "KANJIDIC_Character" (
  "literal" CHAR(1) NOT NULL PRIMARY KEY,
  "grade" INTEGER CHECK ("grade" BETWEEN 1 AND 10),
--- a/migrations/0011_KanjiVG.sql
+++ b/migrations/0011_KanjiVG.sql
@@ -0,0 +1,45 @@
+CREATE TABLE "KanjiVG_Version" (
+  "version" VARCHAR(10) PRIMARY KEY NOT NULL,
+  "date" DATE NOT NULL,
+  "hash" VARCHAR(64) NOT NULL
+) WITHOUT ROWID;
+
+CREATE TRIGGER "KanjiVG_Version_SingleRow"
+BEFORE INSERT ON "KanjiVG_Version"
+WHEN (SELECT COUNT(*) FROM "KanjiVG_Version") >= 1
+BEGIN
+    SELECT RAISE(FAIL, 'Only one row allowed in KanjiVG_Version');
+END;
+
+CREATE TABLE "KanjiVG_Entry" (
+  "character" CHAR(1) PRIMARY KEY NOT NULL
+) WITHOUT ROWID;
+
+CREATE TABLE "KanjiVG_StrokeNumber" (
+  "character" CHAR(1) NOT NULL REFERENCES "KanjiVG_Entry"("character"),
+  "strokeNum" INTEGER NOT NULL,
+  "x" REAL NOT NULL,
+  "y" REAL NOT NULL,
+  PRIMARY KEY ("character", "strokeNum")
+) WITHOUT ROWID;
+
+CREATE TABLE "KanjiVG_Path" (
+  "character" CHAR(1) NOT NULL REFERENCES "KanjiVG_Entry"("character"),
+  "pathId" TEXT NOT NULL,
+  "type" VARCHAR(10) NOT NULL,
+  "svgPath" TEXT NOT NULL,
+  PRIMARY KEY ("character", "pathId")
+) WITHOUT ROWID;
+
+CREATE TABLE "KanjiVG_PathGroup" (
+  "character" CHAR(1) NOT NULL REFERENCES "KanjiVG_Entry"("character"),
+  "groupId" TEXT NOT NULL,
+  "parentGroupId" TEXT REFERENCES "KanjiVG_PathGroup"("groupId"),
+  "element" TEXT,
+  "original" TEXT,
+  "position" VARCHAR(10),
+  "radical" TEXT,
+  "part" INTEGER,
+  PRIMARY KEY ("character", "groupId"),
+  CHECK ("position" IN ('bottom', 'kamae', 'kamaec', 'left', 'middle', 'nyo', 'nyoc', 'right', 'tare', 'tarec', 'top') OR "position" IS NULL)
+) WITHOUT ROWID;
--- a/test/const_data/kanji_grades.dart
+++ b/test/const_data/kanji_grades.dart
@@ -0,0 +1,21 @@
+import 'package:collection/collection.dart';
+import 'package:jadb/const_data/kanji_grades.dart';
+import 'package:test/test.dart';
+
+void main() {
+  test('All constant kanji in jouyouKanjiByGrades are 2136 in total', () {
+    expect(jouyouKanjiByGrades.values.flattenedToSet.length, 2136);
+  });
+
+  // test('All constant kanji in jouyouKanjiByGrades are present in KANJIDIC2', () {
+
+  // });
+
+  // test('All constant kanji in jouyouKanjiByGrades have matching grade as in KANJIDIC2', () {
+
+  // });
+
+  // test('All constant kanji in jouyouKanjiByGradesAndStrokeCount have matching stroke count as in KANJIDIC2', () {
+
+  // });
+}
--- a/test/const_data/radicals_test.dart
+++ b/test/const_data/radicals_test.dart
@@ -0,0 +1,17 @@
+import 'package:collection/collection.dart';
+import 'package:jadb/const_data/radicals.dart';
+import 'package:test/test.dart';
+
+void main() {
+  test('All constant radicals are 253 in total', () {
+    expect(radicals.values.flattenedToSet.length, 253);
+  });
+
+  // test('All constant radicals have at least 1 associated kanji in KANJIDIC2', () {
+
+  // });
+
+  // test('All constant radicals match the stroke order listed in KANJIDIC2', () {
+
+  // });
+}
--- a/test/jouyou_kanji_test.dart
+++ b/test/jouyou_kanji_test.dart
@@ -1,9 +0,0 @@
-import 'package:collection/collection.dart';
-import 'package:jadb/const_data/kanji_grades.dart';
-import 'package:test/test.dart';
-
-void main() {
-  test('Assert 2136 kanji in jouyou set', () {
-    expect(JOUYOU_KANJI_BY_GRADES.values.flattenedToSet.length, 2136);
-  });
-}
--- a/test/models/create_empty_db_test.dart
+++ b/test/models/create_empty_db_test.dart
@@ -1,21 +1,20 @@
-import 'dart:ffi';
-import 'dart:io';
-
 import 'package:jadb/models/create_empty_db.dart';
 import 'package:jadb/search.dart';
 import 'package:sqflite_common_ffi/sqflite_ffi.dart';
 // import 'package:sqlite3/open.dart';
 import 'package:test/test.dart';

-Future<DatabaseExecutor> setup_inmemory_database() async {
-  final dbConnection = await createDatabaseFactoryFfi().openDatabase(':memory:');
+Future<DatabaseExecutor> setupInMemoryDatabase() async {
+  final dbConnection = await createDatabaseFactoryFfi().openDatabase(
+    ':memory:',
+  );

  return dbConnection;
 }

 void main() {
  test('Create empty db', () async {
-    final db = await setup_inmemory_database();
+    final db = await setupInMemoryDatabase();

    await createEmptyDb(db);

--- a/test/search/filter_kanji_test.dart
+++ b/test/search/filter_kanji_test.dart
@@ -5,7 +5,7 @@ import 'setup_database_connection.dart';

 void main() {
  test('Filter kanji', () async {
-    final connection = await setup_database_connection();
+    final connection = await setupDatabaseConnection();

    final result = await connection.filterKanji([
      'a',
@@ -26,4 +26,27 @@ void main() {

    expect(result.join(), '漢字地字');
  });
+
+  test('Filter kanji - deduplicate', () async {
+    final connection = await setupDatabaseConnection();
+
+    final result = await connection.filterKanji([
+      'a',
+      'b',
+      'c',
+      '漢',
+      '字',
+      '地',
+      '字',
+      'か',
+      'な',
+      '.',
+      '!',
+      '@',
+      ';',
+      '々',
+    ], deduplicate: true);
+
+    expect(result.join(), '漢字地');
+  });
 }
--- a/test/search/kanji_search_test.dart
+++ b/test/search/kanji_search_test.dart
@@ -6,16 +6,16 @@ import 'setup_database_connection.dart';

 void main() {
  test('Search a kanji', () async {
-    final connection = await setup_database_connection();
+    final connection = await setupDatabaseConnection();

    final result = await connection.jadbSearchKanji('漢');
    expect(result, isNotNull);
  });

  group('Search all jouyou kanji', () {
-    JOUYOU_KANJI_BY_GRADES.forEach((grade, characters) {
+    jouyouKanjiByGrades.forEach((grade, characters) {
      test('Search all kanji in grade $grade', () async {
-        final connection = await setup_database_connection();
+        final connection = await setupDatabaseConnection();

        for (final character in characters) {
          final result = await connection.jadbSearchKanji(character);
--- a/test/search/search_match_inference_test.dart
+++ b/test/search/search_match_inference_test.dart
@@ -191,4 +191,67 @@ void main() {
      ),
    ]);
  });
+
+  test('Infer match with no matches', () {
+    final wordSearchResult = WordSearchResult(
+      entryId: 0,
+      score: 0,
+      isCommon: false,
+      jlptLevel: JlptLevel.none,
+      kanjiInfo: {},
+      readingInfo: {},
+      japanese: [WordSearchRuby(base: '仮名', furigana: 'かな')],
+      senses: [
+        WordSearchSense(
+          antonyms: [],
+          dialects: [],
+          englishDefinitions: ['kana'],
+          fields: [],
+          info: [],
+          languageSource: [],
+          misc: [],
+          partsOfSpeech: [],
+          restrictedToKanji: [],
+          restrictedToReading: [],
+          seeAlso: [],
+        ),
+      ],
+      sources: WordSearchSources.empty(),
+    );
+
+    wordSearchResult.inferMatchSpans('xyz');
+
+    expect(wordSearchResult.matchSpans, isEmpty);
+  });
+
+  test('Infer multiple matches of same substring', () {
+    final wordSearchResult = WordSearchResult(
+      entryId: 0,
+      score: 0,
+      isCommon: false,
+      jlptLevel: JlptLevel.none,
+      kanjiInfo: {},
+      readingInfo: {},
+      japanese: [WordSearchRuby(base: 'ああ')],
+      senses: [],
+      sources: WordSearchSources.empty(),
+    );
+
+    wordSearchResult.inferMatchSpans('あ');
+
+    expect(wordSearchResult.matchSpans, [
+      WordSearchMatchSpan(
+        spanType: WordSearchMatchSpanType.kanji,
+        start: 0,
+        end: 1,
+        index: 0,
+      ),
+      WordSearchMatchSpan(
+        spanType: WordSearchMatchSpanType.kanji,
+        start: 1,
+        end: 2,
+        index: 0,
+      ),
+    ]);
+  });
 }
--- a/test/search/setup_database_connection.dart
+++ b/test/search/setup_database_connection.dart
@@ -3,7 +3,7 @@ import 'dart:io';
 import 'package:jadb/_data_ingestion/open_local_db.dart';
 import 'package:sqflite_common/sqlite_api.dart';

-Future<Database> setup_database_connection() async {
+Future<Database> setupDatabaseConnection() async {
  final libSqlitePath = Platform.environment['LIBSQLITE_PATH'];
  final jadbPath = Platform.environment['JADB_PATH'];

--- a/test/search/word_search_test.dart
+++ b/test/search/word_search_test.dart
@@ -5,43 +5,43 @@ import 'setup_database_connection.dart';

 void main() {
  test('Search a word  - english - auto', () async {
-    final connection = await setup_database_connection();
+    final connection = await setupDatabaseConnection();
    final result = await connection.jadbSearchWord('kana');
    expect(result, isNotNull);
  });

  test('Get word search count - english - auto', () async {
-    final connection = await setup_database_connection();
+    final connection = await setupDatabaseConnection();
    final result = await connection.jadbSearchWordCount('kana');
    expect(result, isNotNull);
  });

  test('Search a word  - japanese kana - auto', () async {
-    final connection = await setup_database_connection();
+    final connection = await setupDatabaseConnection();
    final result = await connection.jadbSearchWord('かな');
    expect(result, isNotNull);
  });

  test('Get word search count - japanese kana - auto', () async {
-    final connection = await setup_database_connection();
+    final connection = await setupDatabaseConnection();
    final result = await connection.jadbSearchWordCount('かな');
    expect(result, isNotNull);
  });

  test('Search a word  - japanese kanji - auto', () async {
-    final connection = await setup_database_connection();
+    final connection = await setupDatabaseConnection();
    final result = await connection.jadbSearchWord('仮名');
    expect(result, isNotNull);
  });

  test('Get word search count - japanese kanji - auto', () async {
-    final connection = await setup_database_connection();
+    final connection = await setupDatabaseConnection();
    final result = await connection.jadbSearchWordCount('仮名');
    expect(result, isNotNull);
  });

  test('Get a word by id', () async {
-    final connection = await setup_database_connection();
+    final connection = await setupDatabaseConnection();
    final result = await connection.jadbGetWordById(1577090);
    expect(result, isNotNull);
  });
@@ -49,7 +49,7 @@ void main() {
  test(
    'Serialize all words',
    () async {
-      final connection = await setup_database_connection();
+      final connection = await setupDatabaseConnection();

      // Test serializing all words
      for (final letter in 'aiueoksthnmyrw'.split('')) {
--- a/test/util/lemmatizer/lemmatizer_test.dart
+++ b/test/util/lemmatizer/lemmatizer_test.dart
@@ -0,0 +1,51 @@
+import 'package:jadb/util/lemmatizer/lemmatizer.dart';
+import 'package:jadb/util/lemmatizer/rules/godan_verbs.dart';
+import 'package:jadb/util/lemmatizer/rules/ichidan_verbs.dart';
+import 'package:test/test.dart';
+
+const List<String> ichidanVerbs = [
+  '食べる',
+  '食べた',
+  '食べさせられた',
+  '食べたい',
+  '食べたくない',
+  '食べたくなかった',
+];
+const List<String> godanVerbs = [
+  '泳ぐ',
+  '泳いだ',
+  '泳げる',
+  // '泳げれた',
+];
+
+bool findRuleRecursively(Lemmatized result, LemmatizationRule expectedRule) {
+  if (result.rule == expectedRule) {
+    return true;
+  }
+
+  for (final c in result.children) {
+    if (findRuleRecursively(c, expectedRule)) {
+      return true;
+    }
+  }
+
+  return false;
+}
+
+void main() {
+  group('Lemmatize Ichidan Verbs', () {
+    for (final v in ichidanVerbs) {
+      test('Lemmatize Ichidan Verb $v', () {
+        expect(findRuleRecursively(lemmatize(v), ichidanVerbBase), true);
+      });
+    }
+  });
+
+  group('Lemmatize Godan Verbs', () {
+    for (final v in godanVerbs) {
+      test('Lemmatize Godan Verb $v', () {
+        expect(findRuleRecursively(lemmatize(v), godanVerbBase), true);
+      });
+    }
+  });
+}
--- a/test/util/lemmatizer/rules/godan_verbs_test.dart
+++ b/test/util/lemmatizer/rules/godan_verbs_test.dart
@@ -0,0 +1,14 @@
+import 'package:jadb/util/lemmatizer/rules/godan_verbs.dart';
+import 'package:test/test.dart';
+
+void main() {
+  test('Test Godan Verb Base Rule', () {
+    expect(godanVerbBase.matches('泳ぐ'), true);
+    expect(godanVerbBase.apply('泳ぐ'), ['泳ぐ']);
+  });
+
+  test('Test Godan Verb Negative Rule', () {
+    expect(godanVerbNegative.matches('泳がない'), true);
+    expect(godanVerbNegative.apply('泳がない'), ['泳ぐ']);
+  });
+}
--- a/test/util/lemmatizer/rules/i_adjectives_test.dart
+++ b/test/util/lemmatizer/rules/i_adjectives_test.dart
@@ -0,0 +1,15 @@
+import 'package:jadb/util/lemmatizer/rules/i_adjectives.dart';
+import 'package:test/test.dart';
+
+void main() {
+  test('Test i-adjective Base Rule', () {
+    expect(iAdjectiveBase.matches('怪しい'), true);
+    expect(iAdjectiveBase.apply('怪しい'), ['怪しい']);
+  });
+
+
+  test('Test i-adjective Negative Rule', () {
+    expect(iAdjectiveNegative.matches('怪しくない'), true);
+    expect(iAdjectiveNegative.apply('怪しくない'), ['怪しい']);
+  });
+}
--- a/test/util/lemmatizer/rules/ichidan_verbs_test.dart
+++ b/test/util/lemmatizer/rules/ichidan_verbs_test.dart
@@ -0,0 +1,14 @@
+import 'package:jadb/util/lemmatizer/rules/ichidan_verbs.dart';
+import 'package:test/test.dart';
+
+void main() {
+  test('Test Ichidan Verb Base Rule', () {
+    expect(ichidanVerbBase.matches('食べる'), true);
+    expect(ichidanVerbBase.apply('食べる'), ['食べる']);
+  });
+
+  test('Test Ichidan Verb Negative Rule', () {
+    expect(ichidanVerbNegative.matches('食べない'), true);
+    expect(ichidanVerbNegative.apply('食べない'), ['食べる']);
+  });
+}
--- a/test/util/lemmatizer/rules_test.dart
+++ b/test/util/lemmatizer/rules_test.dart
@@ -0,0 +1,15 @@
+import 'package:jadb/util/lemmatizer/lemmatizer.dart';
+import 'package:jadb/util/lemmatizer/rules.dart';
+import 'package:test/test.dart';
+
+void main() {
+  test('Assert lemmatizerRulesByWordClass is correct', () {
+    for (final entry in lemmatizationRulesByWordClass.entries) {
+      final WordClass wordClass = entry.key;
+      final List<LemmatizationRule> rules = entry.value;
+      for (final LemmatizationRule rule in rules) {
+        expect(wordClass, rule.wordClass);
+      }
+    }
+  });
+}
--- a/test/util/romaji_transliteration_test.dart
+++ b/test/util/romaji_transliteration_test.dart
@@ -37,6 +37,35 @@ void main() {
    });
  });

+  group('Romaji -> Hiragana Spans', () {
+    void Function() expectSpans(String input, List<String> expected) => () {
+      final result = transliterateLatinToHiraganaSpan(input);
+      final trans = transliterateLatinToHiragana(input);
+      for (int i = 0; i < result.length; i++) {
+        expect(
+          trans.substring(
+            result[i].$2,
+            i == result.length - 1 ? trans.length : result[i + 1].$2,
+          ),
+          expected[i],
+        );
+      }
+    };
+
+    test('Basic test', expectSpans('katamari', ['か', 'た', 'ま', 'り']));
+    test(
+      'Basic test with diacritics',
+      expectSpans('gadamari', ['が', 'だ', 'ま', 'り']),
+    );
+    test('wi and we', expectSpans('wiwe', ['うぃ', 'うぇ']));
+    test('nb = mb', expectSpans('kanpai', ['か', 'ん', 'ぱ', 'い']));
+    test('nb = mb', expectSpans('kampai', ['か', 'ん', 'ぱ', 'い']));
+    test('Double n', expectSpans('konnichiha', ['こ', 'ん', 'に', 'ち', 'は']));
+
+    // TODO: fix the implementation
+    // test('Double consonant', expectSpans('kappa', ['か', 'っぱ']));
+  });
+
  group('Hiragana -> Romaji', () {
    test('Basic test', () {
      final result = transliterateHiraganaToLatin('かたまり');
@@ -63,4 +92,31 @@ void main() {
      expect(result, 'kappa');
    });
  });
+
+  group('Hiragana -> Romaji Spans', () {
+    void Function() expectSpans(String input, List<String> expected) => () {
+      final result = transliterateHiraganaToLatinSpan(input);
+      final trans = transliterateHiraganaToLatin(input);
+      for (int i = 0; i < result.length; i++) {
+        expect(
+          trans.substring(
+            result[i].$2,
+            i == result.length - 1 ? trans.length : result[i + 1].$2,
+          ),
+          expected[i],
+        );
+      }
+    };
+
+    test('Basic test', expectSpans('かたまり', ['ka', 'ta', 'ma', 'ri']));
+    test(
+      'Basic test with diacritics',
+      expectSpans('がだまり', ['ga', 'da', 'ma', 'ri']),
+    );
+    test('wi and we', expectSpans('うぃうぇ', ['whi', 'whe']));
+    test('Double n', expectSpans('こんにちは', ['ko', 'n', 'ni', 'chi', 'ha']));
+
+    // TODO: fix the implementation
+    // test('Double consonant', expectSpans('かっぱ', ['ka', 'ppa']));
+  });
 }
Author	SHA1	Message	Date
h7x4	e67d906b3c	WIP: add kanjivg data All checks were successful Build and test / evals (push) Successful in 37m9s Details	2026-03-03 13:47:59 +09:00
h7x4	0f7854a4fc	migrations: add version tables for all data sources All checks were successful Build and test / evals (push) Successful in 11m34s Details	2026-03-03 12:59:58 +09:00
h7x4	a86f857553	util/romaji_transliteration: add functions to generate transliteration spans All checks were successful Build and test / evals (push) Successful in 18m58s Details	2026-03-02 18:23:36 +09:00
h7x4	d14e3909d4	search/filter_kanji: keep order when deduplicating All checks were successful Build and test / evals (push) Successful in 13m33s Details	2026-03-02 17:37:45 +09:00
h7x4	bb44bf786a	tests: move const_data tests to `test/const_data` All checks were successful Build and test / evals (push) Successful in 11m38s Details	2026-03-02 17:16:14 +09:00
h7x4	ad3343a01e	README: add link to coverage All checks were successful Build and test / evals (push) Successful in 13m25s Details	2026-03-02 15:02:36 +09:00
h7x4	16d72e94ba	WIP: .gitea/workflows: generate coverage All checks were successful Build and test / evals (push) Successful in 13m17s Details	2026-03-02 14:34:08 +09:00
h7x4	b070a1fd31	.gitea/workflows: merge build and test pipeline	2026-03-02 14:31:59 +09:00
h7x4	dcf5c8ebe7	lemmatizer: implement equality for `AllomorphPattern`/`LemmatizationRule`	2026-03-02 12:01:13 +09:00
h7x4	1f8bc8bac5	lemmatizer: let `LemmatizationRule.validChildClasses` be a set	2026-03-02 12:01:13 +09:00
h7x4	ab28b5788b	search/word_search: fix english queries without `pageSize`/`offset`	2026-03-02 12:01:13 +09:00
h7x4	dd7b2917dc	flake.nix: add `lcov` to devshell	2026-03-02 12:01:13 +09:00
h7x4	74798c77b5	flake.nix: add libsqlite to `LD_LIBRARY_PATH` in devshell	2026-03-02 12:01:12 +09:00
h7x4	63a4caa626	lemmatizer/rules/ichidan: add informal conditionals	2026-03-02 12:01:12 +09:00
h7x4	374be5ca6b	lemmatizer: add some basic tests	2026-03-02 12:01:12 +09:00
h7x4	4a6fd41f31	lemmatizer: misc small improvements	2026-03-02 12:01:12 +09:00
h7x4	c06fff9e5a	lemmatizer/rules: name all rules as separate static variables	2026-03-02 12:01:12 +09:00
h7x4	1d9928ade1	search/kanji: split queries into separate functions	2026-03-02 12:01:11 +09:00
h7x4	1a3b04be00	word_search_result: add romanization getters	2026-03-02 12:01:11 +09:00
h7x4	c0c6f97a01	search/word_search: fix casing of `SearchMode` variants	2026-03-02 12:01:11 +09:00
h7x4	a954188d5d	Fix a few lints	2026-03-02 12:01:11 +09:00
h7x4	5b86d6eb67	README: add textual overview of the word search procedure	2026-03-02 12:01:11 +09:00
h7x4	72f31e974b	dart format	2026-03-02 12:01:10 +09:00
h7x4	e824dc0a22	search/word_search: split data queries into functions	2026-03-02 12:01:10 +09:00
h7x4	f5bca61839	flake.lock: bump Some checks failed Build database / evals (push) Successful in 10m44s Details Run tests / evals (push) Failing after 43m13s Details	2026-02-25 16:28:18 +09:00
h7x4	056aaaa0ce	tests/search_match_inference: add more cases Some checks failed Build database / evals (push) Has been cancelled Details Run tests / evals (push) Has been cancelled Details	2026-02-25 12:42:38 +09:00