Split into files

2020-06-22 15:18:48 +02:00 · 2020-06-22 15:18:48 +02:00 · 86b8ccfdbb
parent 39c2eed084
commit 86b8ccfdbb
8 changed files with 488 additions and 779 deletions
--- a/lib/src/baseURI.dart
+++ b/lib/src/baseURI.dart
@ -0,0 +1,3 @@
+const String JISHO_API = 'https://jisho.org/api/v1/search/words';
+const String SCRAPE_BASE_URI = 'https://jisho.org/search/';
+const String STROKE_ORDER_DIAGRAM_BASE_URI = 'https://classic.jisho.org/static/images/stroke_diagrams/';
--- a/lib/src/exampleSearch.dart
+++ b/lib/src/exampleSearch.dart
@ -0,0 +1,108 @@
+import './baseURI.dart';
+import './objects.dart';
+
+import 'package:html/parser.dart';
+import 'package:html/dom.dart';
+
+final RegExp kanjiRegex = RegExp(r'[\u4e00-\u9faf\u3400-\u4dbf]');
+
+String uriForExampleSearch(String phrase) {
+  return '${SCRAPE_BASE_URI}${Uri.encodeComponent(phrase)}%23sentences';
+}
+
+/* TODO: This is the wrong approach. 
+ * Symbols such as 、「」。 are missing in mid sentence
+ * Maybe also JP fullwidth numbers?
+ */
+
+String getEndSymbolsOfExampleSentence(Element ul) {
+  final endSymbols = RegExp(r'<\/li>([^<>]+)$');
+  return endSymbols.firstMatch(ul.innerHtml).group(1);
+}
+
+ExampleResultData getKanjiAndKana(Element div) {
+  final ul = div.querySelector('ul');
+  final contents = ul.children;
+
+  var kanji = '';
+  var kana = '';
+  for (var i = 0; i < contents.length; i += 1) {
+    final content = contents[i];
+    if (content.localName == 'li') {
+      final li = content;
+      final furigana = li.querySelector('.furigana')?.text;
+      final unlifted = li.querySelector('.unlinked')?.text;
+
+      if (furigana != null) {
+        kanji += unlifted;
+        kana += furigana;
+
+        final kanaEnding = [];
+        for (var j = unlifted.length - 1; j > 0; j -= 1) {
+          final char = unlifted[j];
+          if (!kanjiRegex.hasMatch(char)) {
+            kanaEnding.add(char);
+          } else {
+            break;
+          }
+        }
+
+        kana += kanaEnding.reversed.join('');
+      } else {
+        kanji += unlifted;
+        kana += unlifted;
+      }
+    } else {
+      final text = content.text.trim();
+      if (text != null) {
+        kanji += text;
+        kana += text;
+      }
+    }
+  }
+    final endSymbols = getEndSymbolsOfExampleSentence(ul).trim();
+    kanji+= endSymbols;
+    kana += endSymbols;
+
+  return ExampleResultData(
+    kanji: kanji,
+    kana: kana,
+  );
+}
+
+List<ExampleSentencePiece> getPieces(Element sentenceElement) {
+  final pieceElements = sentenceElement.querySelectorAll('li.clearfix');
+  final List<ExampleSentencePiece> pieces = [];
+  for (var pieceIndex = 0; pieceIndex < pieceElements.length; pieceIndex += 1) {
+    final pieceElement = pieceElements[pieceIndex];
+    pieces.add(ExampleSentencePiece(
+      lifted: pieceElement.querySelector('.furigana')?.text,
+      unlifted: pieceElement.querySelector('.unlinked')?.text,
+    ));
+  }
+
+  return pieces;
+}
+
+ExampleResultData parseExampleDiv(Element div) {
+  final result = getKanjiAndKana(div);
+  result.english = div.querySelector('.english').text;
+  result.pieces = getPieces(div) ?? [];
+
+  return result;
+}
+
+ExampleResults parseExamplePageData(String pageHtml, String phrase) {
+  final document = parse(pageHtml);
+  final divs = document.querySelectorAll('.sentence_content');
+
+  final results = divs.map((div) => parseExampleDiv(div)).toList();
+
+  return ExampleResults(
+    query: phrase,
+    found: results.isNotEmpty,
+    results: results ?? [],
+    uri: uriForExampleSearch(phrase),
+    phrase: phrase,
+  );
+}
--- a/lib/src/kanjiSearch.dart
+++ b/lib/src/kanjiSearch.dart
@ -0,0 +1,214 @@
+import './baseURI.dart';
+import './objects.dart';
+
+
+import 'package:html_unescape/html_unescape.dart' as html_entities;
+final htmlUnescape = html_entities.HtmlUnescape();
+
+const String ONYOMI_LOCATOR_SYMBOL = 'On';
+const String KUNYOMI_LOCATOR_SYMBOL = 'Kun';
+
+String removeNewlines(String str) {
+  return str.replaceAll(RegExp(r'(?:\r|\n)') , '').trim();
+}
+
+String uriForKanjiSearch(String kanji) {
+  return '${SCRAPE_BASE_URI}${Uri.encodeComponent(kanji)}%23kanji';
+}
+
+String getUriForStrokeOrderDiagram(String kanji) {
+  return '${STROKE_ORDER_DIAGRAM_BASE_URI}${kanji.codeUnitAt(0)}_frames.png';
+}
+
+bool containsKanjiGlyph(String pageHtml, String kanji) {
+  final kanjiGlyphToken = '<h1 class="character" data-area-name="print" lang="ja">${kanji}</h1>';
+  return pageHtml.contains(kanjiGlyphToken);
+}
+
+String getStringBetweenIndicies(String data, int startIndex, int endIndex) {
+  final result = data.substring(startIndex, endIndex);
+  return removeNewlines(result).trim();
+}
+
+String getStringBetweenStrings(String data, String startString, String endString) {
+  final regex = RegExp('${RegExp.escape(startString)}(.*?)${RegExp.escape(endString)}', dotAll: true);
+  final match = regex.allMatches(data).toList();
+
+  return match.isNotEmpty ? match[0].group(1).toString() : null;
+}
+
+int getIntBetweenStrings(String pageHtml, String startString, String endString) {
+  final  stringBetweenStrings = getStringBetweenStrings(pageHtml, startString, endString);
+  return int.parse(stringBetweenStrings);
+}
+
+List<String> getAllGlobalGroupMatches(String str, RegExp regex) {
+  var regexResults = regex.allMatches(str).toList();
+  List<String> results = [];
+  for (var match in regexResults) {
+    results.add(match.group(1));
+  }
+
+  return results;
+}
+
+List<String> parseAnchorsToArray(String str) {
+  final regex = RegExp(r'<a href=".*?">(.*?)<\/a>');
+  return getAllGlobalGroupMatches(str, regex);
+}
+
+List<String> getYomi(String pageHtml, String yomiLocatorSymbol) {
+  final yomiSection = getStringBetweenStrings(pageHtml, '<dt>${yomiLocatorSymbol}:</dt>', '</dl>');
+  return parseAnchorsToArray(yomiSection ?? '');
+}
+
+List<String> getKunyomi(String pageHtml) {
+  return getYomi(pageHtml, KUNYOMI_LOCATOR_SYMBOL);
+}
+
+List<String> getOnyomi(String pageHtml) {
+  return getYomi(pageHtml, ONYOMI_LOCATOR_SYMBOL);
+}
+
+List<YomiExample> getYomiExamples(String pageHtml, String yomiLocatorSymbol) {
+  final locatorString = '<h2>${yomiLocatorSymbol} reading compounds</h2>';
+  final exampleSection = getStringBetweenStrings(pageHtml, locatorString, '</ul>');
+  if (exampleSection==null) {
+    return null;
+  }
+
+  final regex = RegExp(r'<li>(.*?)<\/li>', dotAll: true);
+  final regexResults = getAllGlobalGroupMatches(exampleSection, regex).map((s) => s.trim());
+
+  final examples = regexResults.map((regexResult) {
+    final examplesLines = regexResult.split('\n').map((s) => s.trim()).toList();
+    return YomiExample(
+      example: examplesLines[0],
+      reading: examplesLines[1].replaceAll('【', '').replaceAll('】', ''),
+      meaning: htmlUnescape.convert(examplesLines[2]),
+    );
+  });
+
+  return examples.toList();
+}
+
+List<YomiExample> getOnyomiExamples(String pageHtml) {
+  return getYomiExamples(pageHtml, ONYOMI_LOCATOR_SYMBOL);
+}
+
+List<YomiExample> getKunyomiExamples(String pageHtml) {
+  return getYomiExamples(pageHtml, KUNYOMI_LOCATOR_SYMBOL);
+}
+
+Radical getRadical(String pageHtml) {
+  const radicalMeaningStartString = '<span class="radical_meaning">';
+  const radicalMeaningEndString = '</span>';
+
+  var radicalMeaning = getStringBetweenStrings(
+    pageHtml,
+    radicalMeaningStartString,
+    radicalMeaningEndString,
+  ).trim();
+
+  if (radicalMeaning!=null) {
+    final radicalMeaningStartIndex = pageHtml.indexOf(radicalMeaningStartString);
+
+    final radicalMeaningEndIndex = pageHtml.indexOf(
+      radicalMeaningEndString,
+      radicalMeaningStartIndex,
+    );
+
+    final radicalSymbolStartIndex = radicalMeaningEndIndex + radicalMeaningEndString.length;
+    const radicalSymbolEndString = '</span>';
+    final radicalSymbolEndIndex = pageHtml.indexOf(radicalSymbolEndString, radicalSymbolStartIndex);
+
+    final radicalSymbolsString = getStringBetweenIndicies(
+      pageHtml,
+      radicalSymbolStartIndex,
+      radicalSymbolEndIndex,
+    );
+
+    if (radicalSymbolsString.length > 1) {
+      final radicalForms = radicalSymbolsString
+        .substring(1)
+        .replaceAll('(', '')
+        .replaceAll(')', '')
+        .trim()
+        .split(', ');
+
+      return Radical(
+        symbol: radicalSymbolsString[0],
+        forms: radicalForms ?? [],
+        meaning: radicalMeaning
+      );
+    }
+
+    return Radical (
+      symbol: radicalSymbolsString,
+      meaning: radicalMeaning
+    );
+  }
+
+  return null;
+}
+
+List<String> getParts(String pageHtml) {
+  const partsSectionStartString = '<dt>Parts:</dt>';
+  const partsSectionEndString = '</dl>';
+
+  final partsSection = getStringBetweenStrings(
+    pageHtml,
+    partsSectionStartString,
+    partsSectionEndString,
+  );
+
+  var result = parseAnchorsToArray(partsSection);
+  result.sort();
+
+  return (result);
+}
+
+String getSvgUri(String pageHtml) {
+  var svgRegex = RegExp('\/\/.*?.cloudfront.net\/.*?.svg');
+  final regexResult = svgRegex.firstMatch(pageHtml).group(0).toString();
+  return regexResult.isNotEmpty ? 'https:${regexResult}' : null;
+}
+
+String getGifUri(String kanji) {
+  final unicodeString = kanji.codeUnitAt(0).toRadixString(16);
+  final fileName = '${unicodeString}.gif';
+  final animationUri = 'https://raw.githubusercontent.com/mistval/kanji_images/master/gifs/${fileName}';
+
+  return animationUri;
+}
+
+int getNewspaperFrequencyRank(String pageHtml) {
+  final frequencySection = getStringBetweenStrings(pageHtml, '<div class="frequency">', '</div>');
+  return (frequencySection != null) ? int.parse(getStringBetweenStrings(frequencySection, '<strong>', '</strong>')) : null;
+}
+
+KanjiResult parseKanjiPageData(String pageHtml, String kanji) {
+  final result = KanjiResult();
+  result.query = kanji;
+  result.found = containsKanjiGlyph(pageHtml, kanji);
+  if (result.found==false) {
+    return result;
+  }
+
+  result.taughtIn = getStringBetweenStrings(pageHtml, 'taught in <strong>', '</strong>');
+  result.jlptLevel = getStringBetweenStrings(pageHtml, 'JLPT level <strong>', '</strong>');
+  result.newspaperFrequencyRank = getNewspaperFrequencyRank(pageHtml);
+  result.strokeCount = getIntBetweenStrings(pageHtml, '<strong>', '</strong> strokes');
+  result.meaning = htmlUnescape.convert(removeNewlines(getStringBetweenStrings(pageHtml, '<div class="kanji-details__main-meanings">', '</div>')).trim());
+  result.kunyomi = getKunyomi(pageHtml) ?? [];
+  result.onyomi = getOnyomi(pageHtml) ?? [];
+  result.onyomiExamples = getOnyomiExamples(pageHtml) ?? [];
+  result.kunyomiExamples = getKunyomiExamples(pageHtml) ?? [];
+  result.radical = getRadical(pageHtml);
+  result.parts = getParts(pageHtml) ?? [];
+  result.strokeOrderDiagramUri = getUriForStrokeOrderDiagram(kanji);
+  result.strokeOrderSvgUri = getSvgUri(pageHtml);
+  result.strokeOrderGifUri = getGifUri(kanji);
+  result.uri = uriForKanjiSearch(kanji);
+  return result;
+}
--- a/lib/src/phraseScrape.dart
+++ b/lib/src/phraseScrape.dart
@ -0,0 +1,154 @@
+import './objects.dart';
+import './exampleSearch.dart';
+
+import 'package:html/parser.dart';
+import 'package:html/dom.dart';
+
+List<String> getTags(Document document) {
+  final List<String> tags = [];
+  final tagElements = document.querySelectorAll('.concept_light-tag');
+
+  for (var i = 0; i < tagElements.length; i += 1) {
+    final tagText = tagElements[i].text;
+    tags.add(tagText);
+  }
+
+  return tags;
+}
+
+List<String> getMostRecentWordTypes(Element child) {
+  return child.text.split(',').map((s) => s.trim().toLowerCase()).toList();
+}
+
+List<KanjiKanaPair> getOtherForms(Element child) {
+  return child.text.split('、')
+    .map((s) => s.replaceAll('【', '').replaceAll('】', '').split(' '))
+    .map((a) => (KanjiKanaPair( kanji: a[0], kana: (a.length == 2) ? a[1] : null ))).toList();
+}
+
+List<String> getNotes(Element child) => child.text.split('\n');
+
+String getMeaning(Element child) => child.querySelector('.meaning-meaning').text;
+
+String getMeaningAbstract(Element child) {
+  final meaningAbstract = child.querySelector('.meaning-abstract');
+  if (meaningAbstract == null) return null;
+  
+  for (var element in meaningAbstract.querySelectorAll('a')) {
+    element.remove();
+  }
+
+  return child.querySelector('.meaning-abstract')?.text;
+}
+
+List<String> getSupplemental(Element child) {
+  final supplemental = child.querySelector('.supplemental_info');
+  if (supplemental == null) return [];
+  return supplemental.text.split(',').map((s) => s.trim()).toList();
+}
+
+List<String> getSeeAlsoTerms(List<String> supplemental) {
+  if (supplemental == null) return [];
+
+  final List<String> seeAlsoTerms = [];
+  for (var i = supplemental.length - 1; i >= 0; i -= 1) {
+    final supplementalEntry = supplemental[i];
+    if (supplementalEntry.startsWith('See also')) {
+      seeAlsoTerms.add(supplementalEntry.replaceAll('See also ', ''));
+      supplemental.removeAt(i);
+    }
+  }
+  return seeAlsoTerms;
+}
+
+List<PhraseScrapeSentence> getSentences(Element child) {
+  final sentenceElements = child.querySelector('.sentences')?.querySelectorAll('.sentence');
+  if (sentenceElements == null) return [];
+
+  final List<PhraseScrapeSentence> sentences = [];
+  for (var sentenceIndex = 0; sentenceIndex < (sentenceElements?.length ?? 0); sentenceIndex += 1) {
+    final sentenceElement = sentenceElements[sentenceIndex];
+
+    final english = sentenceElement.querySelector('.english').text;
+    final pieces = getPieces(sentenceElement);
+
+    sentenceElement.querySelector('.english').remove();
+    for (var element in sentenceElement.children[0].children) {
+      element.querySelector('.furigana')?.remove();
+    }
+
+    final japanese = sentenceElement.text;
+
+    sentences.add(
+      PhraseScrapeSentence(
+        english: english,
+        japanese: japanese,
+        pieces: pieces ?? []
+      )
+    );
+  }
+
+  return sentences;
+}
+
+PhrasePageScrapeResult getMeaningsOtherFormsAndNotes(Document document) {
+  final returnValues = PhrasePageScrapeResult( otherForms: [], notes: [] );
+
+  final meaningsWrapper = document.querySelector('.meanings-wrapper');
+  if (meaningsWrapper == null) return PhrasePageScrapeResult(found: false);
+  returnValues.found = true;
+
+  final meaningsChildren = meaningsWrapper.children;
+
+  final List<PhraseScrapeMeaning> meanings = [];
+  var mostRecentWordTypes = [];
+  for (var meaningIndex = 0; meaningIndex < meaningsChildren.length; meaningIndex += 1) {
+    final child = meaningsChildren[meaningIndex];
+
+    if (child.className.contains('meaning-tags')) {
+      mostRecentWordTypes = getMostRecentWordTypes(child);
+
+    } else if (mostRecentWordTypes[0] == 'other forms') {
+      returnValues.otherForms = getOtherForms(child);
+
+    } else if (mostRecentWordTypes[0] == 'notes') {
+      returnValues.notes = getNotes(child);
+
+    } else {
+      final meaning = getMeaning(child);
+      final meaningAbstract = getMeaningAbstract(child);
+      final supplemental = getSupplemental(child);
+      final seeAlsoTerms = getSeeAlsoTerms(supplemental);
+      final sentences = getSentences(child);
+
+      meanings.add(PhraseScrapeMeaning(
+        seeAlsoTerms: seeAlsoTerms ?? [],
+        sentences: sentences ?? [],
+        definition: meaning,
+        supplemental: supplemental ?? [],
+        definitionAbstract: meaningAbstract,
+        tags: mostRecentWordTypes ?? [],
+      ));
+    }
+  }
+
+  returnValues.meanings = meanings;
+
+  return returnValues;
+}
+
+String uriForPhraseScrape(String searchTerm) {
+  return 'https://jisho.org/word/${Uri.encodeComponent(searchTerm)}';
+}
+
+PhrasePageScrapeResult parsePhrasePageData(String pageHtml, String query) {
+  final document = parse(pageHtml);
+  final result = getMeaningsOtherFormsAndNotes(document);
+
+  result.query = query;
+  if (!result.found) return result;
+  result.uri = uriForPhraseScrape(query);
+  result.tags = getTags(document);
+
+  return result;
+}
--- a/lib/src/phraseSearch.dart
+++ b/lib/src/phraseSearch.dart
@ -0,0 +1,5 @@
+import './baseURI.dart';
+
+String uriForPhraseSearch(String phrase) {
+  return '${JISHO_API}?keyword=${Uri.encodeComponent(phrase)}';
+}
--- a/lib/src/unofficial_jisho_api_base.dart
+++ b/lib/src/unofficial_jisho_api_base.dart
@ -1,489 +1,12 @@
 import 'package:unofficial_jisho_api/src/objects.dart';
 import 'package:http/http.dart' as http;
-import 'package:html_unescape/html_unescape.dart' as html_entities;
 import 'dart:convert';
-import 'package:html/parser.dart';
-import 'package:html/dom.dart';

-final htmlUnescape = html_entities.HtmlUnescape();
+import './phraseSearch.dart';
+import './kanjiSearch.dart';
+import './exampleSearch.dart';
+import './phraseScrape.dart';

-const String JISHO_API = 'https://jisho.org/api/v1/search/words';
-const String SCRAPE_BASE_URI = 'https://jisho.org/search/';
-const String STROKE_ORDER_DIAGRAM_BASE_URI = 'https://classic.jisho.org/static/images/stroke_diagrams/';
-
-/* KANJI SEARCH FUNCTIONS START */
-
-const String ONYOMI_LOCATOR_SYMBOL = 'On';
-const KUNYOMI_LOCATOR_SYMBOL = 'Kun';
-
-String removeNewlines(String str) {
-  return str.replaceAll(RegExp(r'(?:\r|\n)') , '').trim();
-}
-
-String uriForKanjiSearch(String kanji) {
-  return '${SCRAPE_BASE_URI}${Uri.encodeComponent(kanji)}%23kanji';
-}
-
-String getUriForStrokeOrderDiagram(String kanji) {
-  return '${STROKE_ORDER_DIAGRAM_BASE_URI}${kanji.codeUnitAt(0)}_frames.png';
-}
-
-String uriForPhraseSearch(String phrase) {
-  return '${JISHO_API}?keyword=${Uri.encodeComponent(phrase)}';
-}
-
-bool containsKanjiGlyph(String pageHtml, String kanji) {
-  final kanjiGlyphToken = '<h1 class="character" data-area-name="print" lang="ja">${kanji}</h1>';
-  return pageHtml.contains(kanjiGlyphToken);
-}
-
-String getStringBetweenIndicies(String data, int startIndex, int endIndex) {
-  final result = data.substring(startIndex, endIndex);
-  return removeNewlines(result).trim();
-}
-
-String getStringBetweenStrings(String data, String startString, String endString) {
-  final regex = RegExp('${RegExp.escape(startString)}(.*?)${RegExp.escape(endString)}', dotAll: true);
-  final match = regex.allMatches(data).toList();
-
-  return match.isNotEmpty ? match[0].group(1).toString() : null;
-}
-
-int getIntBetweenStrings(String pageHtml, String startString, String endString) {
-  final  stringBetweenStrings = getStringBetweenStrings(pageHtml, startString, endString);
-  return int.parse(stringBetweenStrings);
-}
-
-List<String> getAllGlobalGroupMatches(String str, RegExp regex) {
-  var regexResults = regex.allMatches(str).toList();
-  List<String> results = [];
-  for (var match in regexResults) {
-    results.add(match.group(1));
-  }
-
-  return results;
-}
-
-List<String> parseAnchorsToArray(String str) {
-  final regex = RegExp(r'<a href=".*?">(.*?)<\/a>');
-  return getAllGlobalGroupMatches(str, regex);
-}
-
-List<String> getYomi(String pageHtml, String yomiLocatorSymbol) {
-  final yomiSection = getStringBetweenStrings(pageHtml, '<dt>${yomiLocatorSymbol}:</dt>', '</dl>');
-  return parseAnchorsToArray(yomiSection ?? '');
-}
-
-List<String> getKunyomi(String pageHtml) {
-  return getYomi(pageHtml, KUNYOMI_LOCATOR_SYMBOL);
-}
-
-List<String> getOnyomi(String pageHtml) {
-  return getYomi(pageHtml, ONYOMI_LOCATOR_SYMBOL);
-}
-
-List<YomiExample> getYomiExamples(String pageHtml, String yomiLocatorSymbol) {
-  final locatorString = '<h2>${yomiLocatorSymbol} reading compounds</h2>';
-  final exampleSection = getStringBetweenStrings(pageHtml, locatorString, '</ul>');
-  if (exampleSection==null) {
-    return null;
-  }
-
-  final regex = RegExp(r'<li>(.*?)<\/li>', dotAll: true);
-  final regexResults = getAllGlobalGroupMatches(exampleSection, regex).map((s) => s.trim());
-
-  final examples = regexResults.map((regexResult) {
-    final examplesLines = regexResult.split('\n').map((s) => s.trim()).toList();
-    return YomiExample(
-      example: examplesLines[0],
-      reading: examplesLines[1].replaceAll('【', '').replaceAll('】', ''),
-      meaning: htmlUnescape.convert(examplesLines[2]),
-    );
-  });
-
-  return examples.toList();
-}
-
-List<YomiExample> getOnyomiExamples(String pageHtml) {
-  return getYomiExamples(pageHtml, ONYOMI_LOCATOR_SYMBOL);
-}
-
-List<YomiExample> getKunyomiExamples(String pageHtml) {
-  return getYomiExamples(pageHtml, KUNYOMI_LOCATOR_SYMBOL);
-}
-
-Radical getRadical(String pageHtml) {
-  const radicalMeaningStartString = '<span class="radical_meaning">';
-  const radicalMeaningEndString = '</span>';
-
-  var radicalMeaning = getStringBetweenStrings(
-    pageHtml,
-    radicalMeaningStartString,
-    radicalMeaningEndString,
-  ).trim();
-
-  if (radicalMeaning!=null) {
-    final radicalMeaningStartIndex = pageHtml.indexOf(radicalMeaningStartString);
-
-    final radicalMeaningEndIndex = pageHtml.indexOf(
-      radicalMeaningEndString,
-      radicalMeaningStartIndex,
-    );
-
-    final radicalSymbolStartIndex = radicalMeaningEndIndex + radicalMeaningEndString.length;
-    const radicalSymbolEndString = '</span>';
-    final radicalSymbolEndIndex = pageHtml.indexOf(radicalSymbolEndString, radicalSymbolStartIndex);
-
-    final radicalSymbolsString = getStringBetweenIndicies(
-      pageHtml,
-      radicalSymbolStartIndex,
-      radicalSymbolEndIndex,
-    );
-
-    if (radicalSymbolsString.length > 1) {
-      final radicalForms = radicalSymbolsString
-        .substring(1)
-        .replaceAll('(', '')
-        .replaceAll(')', '')
-        .trim()
-        .split(', ');
-
-      return Radical(
-        symbol: radicalSymbolsString[0],
-        forms: radicalForms ?? [],
-        meaning: radicalMeaning
-      );
-    }
-
-    return Radical (
-      symbol: radicalSymbolsString,
-      meaning: radicalMeaning
-    );
-  }
-
-  return null;
-}
-
-List<String> getParts(String pageHtml) {
-  const partsSectionStartString = '<dt>Parts:</dt>';
-  const partsSectionEndString = '</dl>';
-
-  final partsSection = getStringBetweenStrings(
-    pageHtml,
-    partsSectionStartString,
-    partsSectionEndString,
-  );
-
-  var result = parseAnchorsToArray(partsSection);
-  result.sort();
-
-  return (result);
-}
-
-String getSvgUri(String pageHtml) {
-  var svgRegex = RegExp('\/\/.*?.cloudfront.net\/.*?.svg');
-  final regexResult = svgRegex.firstMatch(pageHtml).group(0).toString();
-  return regexResult.isNotEmpty ? 'https:${regexResult}' : null;
-}
-
-String getGifUri(String kanji) {
-  final unicodeString = kanji.codeUnitAt(0).toRadixString(16);
-  final fileName = '${unicodeString}.gif';
-  final animationUri = 'https://raw.githubusercontent.com/mistval/kanji_images/master/gifs/${fileName}';
-
-  return animationUri;
-}
-
-int getNewspaperFrequencyRank(String pageHtml) {
-  final frequencySection = getStringBetweenStrings(pageHtml, '<div class="frequency">', '</div>');
-  return (frequencySection != null) ? int.parse(getStringBetweenStrings(frequencySection, '<strong>', '</strong>')) : null;
-}
-
-KanjiResult parseKanjiPageData(String pageHtml, String kanji) {
-  final result = KanjiResult();
-  result.query = kanji;
-  result.found = containsKanjiGlyph(pageHtml, kanji);
-  if (result.found==false) {
-    return result;
-  }
-
-  result.taughtIn = getStringBetweenStrings(pageHtml, 'taught in <strong>', '</strong>');
-  result.jlptLevel = getStringBetweenStrings(pageHtml, 'JLPT level <strong>', '</strong>');
-  result.newspaperFrequencyRank = getNewspaperFrequencyRank(pageHtml);
-  result.strokeCount = getIntBetweenStrings(pageHtml, '<strong>', '</strong> strokes');
-  result.meaning = htmlUnescape.convert(removeNewlines(getStringBetweenStrings(pageHtml, '<div class="kanji-details__main-meanings">', '</div>')).trim());
-  result.kunyomi = getKunyomi(pageHtml) ?? [];
-  result.onyomi = getOnyomi(pageHtml) ?? [];
-  result.onyomiExamples = getOnyomiExamples(pageHtml) ?? [];
-  result.kunyomiExamples = getKunyomiExamples(pageHtml) ?? [];
-  result.radical = getRadical(pageHtml);
-  result.parts = getParts(pageHtml) ?? [];
-  result.strokeOrderDiagramUri = getUriForStrokeOrderDiagram(kanji);
-  result.strokeOrderSvgUri = getSvgUri(pageHtml);
-  result.strokeOrderGifUri = getGifUri(kanji);
-  result.uri = uriForKanjiSearch(kanji);
-  return result;
-}
-
-/* KANJI SEARCH FUNCTIONS END */
-
-/* EXAMPLE SEARCH FUNCTIONS START */
-
-final RegExp kanjiRegex = RegExp(r'[\u4e00-\u9faf\u3400-\u4dbf]');
-
-String uriForExampleSearch(String phrase) {
-  return '${SCRAPE_BASE_URI}${Uri.encodeComponent(phrase)}%23sentences';
-}
-
-/* TODO: This is the wrong approach. 
- * Symbols such as 、「」。 are missing in mid sentence
- * Maybe also JP fullwidth numbers?
- */
-
-String getEndSymbolsOfExampleSentence(Element ul) {
-  final endSymbols = RegExp(r'<\/li>([^<>]+)$');
-  return endSymbols.firstMatch(ul.innerHtml).group(1);
-}
-
-ExampleResultData getKanjiAndKana(Element div) {
-  final ul = div.querySelector('ul');
-  final contents = ul.children;
-
-  var kanji = '';
-  var kana = '';
-  for (var i = 0; i < contents.length; i += 1) {
-    final content = contents[i];
-    if (content.localName == 'li') {
-      final li = content;
-      final furigana = li.querySelector('.furigana')?.text;
-      final unlifted = li.querySelector('.unlinked')?.text;
-
-      if (furigana != null) {
-        kanji += unlifted;
-        kana += furigana;
-
-        final kanaEnding = [];
-        for (var j = unlifted.length - 1; j > 0; j -= 1) {
-          final char = unlifted[j];
-          if (!kanjiRegex.hasMatch(char)) {
-            kanaEnding.add(char);
-          } else {
-            break;
-          }
-        }
-
-        kana += kanaEnding.reversed.join('');
-      } else {
-        kanji += unlifted;
-        kana += unlifted;
-      }
-    } else {
-      final text = content.text.trim();
-      if (text != null) {
-        kanji += text;
-        kana += text;
-      }
-    }
-  }
-    final endSymbols = getEndSymbolsOfExampleSentence(ul).trim();
-    kanji+= endSymbols;
-    kana += endSymbols;
-
-  return ExampleResultData(
-    kanji: kanji,
-    kana: kana,
-  );
-}
-
-List<ExampleSentencePiece> getPieces(Element sentenceElement) {
-  final pieceElements = sentenceElement.querySelectorAll('li.clearfix');
-  final List<ExampleSentencePiece> pieces = [];
-  for (var pieceIndex = 0; pieceIndex < pieceElements.length; pieceIndex += 1) {
-    final pieceElement = pieceElements[pieceIndex];
-    pieces.add(ExampleSentencePiece(
-      lifted: pieceElement.querySelector('.furigana')?.text,
-      unlifted: pieceElement.querySelector('.unlinked')?.text,
-    ));
-  }
-
-  return pieces;
-}
-
-ExampleResultData parseExampleDiv(Element div) {
-  final result = getKanjiAndKana(div);
-  result.english = div.querySelector('.english').text;
-  result.pieces = getPieces(div) ?? [];
-
-  return result;
-}
-
-ExampleResults parseExamplePageData(String pageHtml, String phrase) {
-  final document = parse(pageHtml);
-  final divs = document.querySelectorAll('.sentence_content');
-
-  final results = divs.map((div) => parseExampleDiv(div)).toList();
-
-  return ExampleResults(
-    query: phrase,
-    found: results.isNotEmpty,
-    results: results ?? [],
-    uri: uriForExampleSearch(phrase),
-    phrase: phrase,
-  );
-}
-
-/* EXAMPLE SEARCH FUNCTIONS END */
-
-/* PHRASE SCRAPE FUNCTIONS START */
-
-List<String> getTags(Document document) {
-  final List<String> tags = [];
-  final tagElements = document.querySelectorAll('.concept_light-tag');
-
-  for (var i = 0; i < tagElements.length; i += 1) {
-    final tagText = tagElements[i].text;
-    tags.add(tagText);
-  }
-
-  return tags;
-}
-
-List<String> getMostRecentWordTypes(Element child) {
-  return child.text.split(',').map((s) => s.trim().toLowerCase()).toList();
-}
-
-List<KanjiKanaPair> getOtherForms(Element child) {
-  return child.text.split('、')
-    .map((s) => s.replaceAll('【', '').replaceAll('】', '').split(' '))
-    .map((a) => (KanjiKanaPair( kanji: a[0], kana: (a.length == 2) ? a[1] : null ))).toList();
-}
-
-List<String> getNotes(Element child) => child.text.split('\n');
-
-String getMeaning(Element child) => child.querySelector('.meaning-meaning').text;
-
-String getMeaningAbstract(Element child) {
-  final meaningAbstract = child.querySelector('.meaning-abstract');
-  if (meaningAbstract == null) return null;
-  
-  for (var element in meaningAbstract.querySelectorAll('a')) {
-    element.remove();
-  }
-  
-  return child.querySelector('.meaning-abstract')?.text;
-}
-
-List<String> getSupplemental(Element child) {
-  final supplemental = child.querySelector('.supplemental_info');
-  if (supplemental == null) return [];
-  return supplemental.text.split(',').map((s) => s.trim()).toList();
-}
-
-List<String> getSeeAlsoTerms(List<String> supplemental) {
-  if (supplemental == null) return [];
-
-  final List<String> seeAlsoTerms = [];
-  for (var i = supplemental.length - 1; i >= 0; i -= 1) {
-    final supplementalEntry = supplemental[i];
-    if (supplementalEntry.startsWith('See also')) {
-      seeAlsoTerms.add(supplementalEntry.replaceAll('See also ', ''));
-      supplemental.removeAt(i);
-    }
-  }
-  return seeAlsoTerms;
-}
-
-List<PhraseScrapeSentence> getSentences(Element child) {
-  final sentenceElements = child.querySelector('.sentences')?.querySelectorAll('.sentence');
-  if (sentenceElements == null) return [];
-
-  final List<PhraseScrapeSentence> sentences = [];
-  for (var sentenceIndex = 0; sentenceIndex < (sentenceElements?.length ?? 0); sentenceIndex += 1) {
-    final sentenceElement = sentenceElements[sentenceIndex];
-
-    final english = sentenceElement.querySelector('.english').text;
-    final pieces = getPieces(sentenceElement);
-
-    sentenceElement.querySelector('.english').remove();
-    for (var element in sentenceElement.children[0].children) {
-      element.querySelector('.furigana')?.remove();
-    }
-
-    final japanese = sentenceElement.text;
-
-    sentences.add(
-      PhraseScrapeSentence(
-        english: english,
-        japanese: japanese,
-        pieces: pieces ?? []
-      )
-    );
-  }
-
-  return sentences;
-}
-
-PhrasePageScrapeResult getMeaningsOtherFormsAndNotes(Document document) {
-  final returnValues = PhrasePageScrapeResult( otherForms: [], notes: [] );
-
-  final meaningsWrapper = document.querySelector('.meanings-wrapper');
-  if (meaningsWrapper == null) return PhrasePageScrapeResult(found: false);
-  returnValues.found = true;
-
-  final meaningsChildren = meaningsWrapper.children;
-
-  final List<PhraseScrapeMeaning> meanings = [];
-  var mostRecentWordTypes = [];
-  for (var meaningIndex = 0; meaningIndex < meaningsChildren.length; meaningIndex += 1) {
-    final child = meaningsChildren[meaningIndex];
-
-    if (child.className.contains('meaning-tags')) {
-      mostRecentWordTypes = getMostRecentWordTypes(child);
-
-    } else if (mostRecentWordTypes[0] == 'other forms') {
-      returnValues.otherForms = getOtherForms(child);
-
-    } else if (mostRecentWordTypes[0] == 'notes') {
-      returnValues.notes = getNotes(child);
-
-    } else {
-      final meaning = getMeaning(child);
-      final meaningAbstract = getMeaningAbstract(child);
-      final supplemental = getSupplemental(child);
-      final seeAlsoTerms = getSeeAlsoTerms(supplemental);
-      final sentences = getSentences(child);
-
-      meanings.add(PhraseScrapeMeaning(
-        seeAlsoTerms: seeAlsoTerms ?? [],
-        sentences: sentences ?? [],
-        definition: meaning,
-        supplemental: supplemental ?? [],
-        definitionAbstract: meaningAbstract,
-        tags: mostRecentWordTypes ?? [],
-      ));
-    }
-  }
-
-  returnValues.meanings = meanings;
-
-  return returnValues;
-}
-
-String uriForPhraseScrape(String searchTerm) {
-  return 'https://jisho.org/word/${Uri.encodeComponent(searchTerm)}';
-}
-
-PhrasePageScrapeResult parsePhrasePageData(String pageHtml, String query) {
-  final document = parse(pageHtml);
-  final result = getMeaningsOtherFormsAndNotes(document);
-
-  result.query = query;
-  if (!result.found) return result;
-  result.uri = uriForPhraseScrape(query);
-  result.tags = getTags(document);
-
-  return result;
-}

 class JishoApi {

--- a/test/local_function_test_cases.dart
+++ b/test/local_function_test_cases.dart
@ -1,293 +0,0 @@
-import 'package:unofficial_jisho_api/src/objects.dart';
-import 'package:unofficial_jisho_api/unofficial_jisho_api.dart';
-
-import 'package:test/test.dart';
-import 'dart:convert';
-import 'package:http/http.dart' as http;
-
-void test_local_functions() async {
-
-
-/* KANJI SEARCH FUNCTION TESTS START */
-
-  test('removeNewLines', () {
-    final result = removeNewlines('Line \nwith\r\n Newlines and spaces\n');
-    expect(result, 'Line with Newlines and spaces');
-  });
-
-  test('uriForKanjiSearch', () {
-    final result = uriForKanjiSearch('時');
-    expect(result, 'https://jisho.org/search/%E6%99%82%23kanji');
-  });
-
-  test('getUriForStrokeOrderDiagram', () {
-    final result = getUriForStrokeOrderDiagram('時');
-    expect(result, 'https://classic.jisho.org/static/images/stroke_diagrams/26178_frames.png');
-  });
-
-  test('uriForPhraseSearch', () {
-    final result = uriForPhraseSearch('時間');
-    expect(result, 'https://jisho.org/api/v1/search/words?keyword=%E6%99%82%E9%96%93');
-  });
-
-  final kanjiPage = (await http.get('https://jisho.org/search/%E6%99%82%23kanji')).body;
-
-  test('containsKanjiGlyph', () {
-    final result = containsKanjiGlyph(kanjiPage, '時');
-    expect(result, true);
-  });
-
-  test('getStringBetweenIndicies', () {
-    final result = getStringBetweenIndicies('String\n\rwith\nNewlines', 3, 9);
-    expect(result, 'ingw');
-  });
-
-  test('getStringBetweenStrings', () {
-    const data = 'STArT I want this string END';
-    final result = getStringBetweenStrings(data, 'STArT', 'END');
-    expect(result, ' I want this string ');
-  });
-
-  test('getIntBetweenStrings', () {
-    final result = getIntBetweenStrings(kanjiPage, '<strong>', '</strong> strokes');
-    expect(result, 10);
-  });
-
-  test('getAllGlobalGroupMatches', () {
-
-  });
-
-  test('parseAnchorsToArray', () {
-    const htmlCode = 
-    '''
-    <div class="test">
-      <p>
-        <a href="https://test.test">Hello</a>
-      </p>
-      <a href="//xyz">Hi</a>
-      <span>
-        <p>
-          <a href="">How are you doing</a>
-        </p>
-      </span>
-    </div>
-    ''';
-
-    final result = parseAnchorsToArray(htmlCode);
-    expect(result, [
-      'Hello', 'Hi', 'How are you doing']);
-  });
-
-  test('getYomi', () {
-    final result = getYomi(kanjiPage, 'On');
-    expect(result, ['ジ']);
-
-  });
-
-  test('getKunyomi', () {
-    final result = getKunyomi(kanjiPage);
-    expect(result, ['とき', '-どき']);
-  });
-
-  test('getOnyomi', () {
-    final result = getOnyomi(kanjiPage);
-    expect(result, ['ジ']);
-  });
-
-  test('getYomiExamples', () {
-    final result = getYomiExamples(kanjiPage, 'On');
-    expect(
-      json.encode(result),
-      json.encode([
-        YomiExample(
-          example: '時',
-          reading: 'ジ',
-          meaning: '''hour, o'clock, (specified) time, when ..., during ...'''
-        ),
-        YomiExample(
-          example: '時価',
-          reading: 'ジカ',
-          meaning: 'current value, price, market value'
-        ),
-        YomiExample(
-          example: '零時',
-          reading: 'レイジ',
-          meaning: '''twelve o'clock, midnight, noon'''
-        ),
-        YomiExample(
-          example: '平時',
-          reading: 'ヘイジ',
-          meaning: 'peacetime, time of peace, ordinary times, normal times'
-        ),
-      ])
-    );
-  });
-
-  test('getOnyomiExamples', () {
-    final result = getOnyomiExamples(kanjiPage);
-    expect(
-      json.encode(result), 
-      json.encode([
-        YomiExample(
-          example: '時',
-          reading: 'ジ',
-          meaning: '''hour, o'clock, (specified) time, when ..., during ...'''
-        ),
-        YomiExample(
-          example: '時価',
-          reading: 'ジカ',
-          meaning: 'current value, price, market value'
-        ),
-        YomiExample(
-          example: '零時',
-          reading: 'レイジ',
-          meaning: '''twelve o'clock, midnight, noon'''
-        ),
-        YomiExample(
-          example: '平時',
-          reading: 'ヘイジ',
-          meaning: 'peacetime, time of peace, ordinary times, normal times'
-        ),
-      ])
-    );
-  });
-
-  test('getKunyomiExamples', () {
-    final result = getKunyomiExamples(kanjiPage);
-    expect(
-      json.encode(result), 
-      json.encode([
-        YomiExample(
-          example: '時',
-          reading: 'とき',
-          meaning: 'time, hour, moment, occasion, case, chance, opportunity, season, the times, the age, the day, tense'
-        ),
-        YomiExample(
-          example: '時折',
-          reading: 'ときおり',
-          meaning: 'sometimes'
-        ),
-        YomiExample(
-          example: '切り替え時',
-          reading: 'きりかえとき',
-          meaning: 'time to switch over, response time'
-        ),
-        YomiExample(
-          example: '逢魔が時',
-          reading: 'おうまがとき',
-          meaning: '''twilight, time for disasters (similar to 'the witching hour' but not midnight)'''
-        ),
-      ])
-    );
-  });
-
-  test('getRadical', () {
-    final result = getRadical(kanjiPage);
-    expect(
-      json.encode(result),
-      json.encode(Radical(
-        symbol: '日',
-        meaning: 'sun, day'
-      ))
-    );
-  });
-
-  test('getParts', () {
-    final result = getParts(kanjiPage);
-    expect(result, ['土', '寸', '日']);
-  });
-
-  test('getSvgUri', () {
-    final result = getSvgUri(kanjiPage);
-    expect(result, 'https://d1w6u4xc3l95km.cloudfront.net/kanji-2015-03/06642.svg');
-  });
-
-  test('getGifUri', () {
-    final result = getGifUri(kanjiPage);
-    expect(result, 'https://raw.githubusercontent.com/mistval/kanji_images/master/gifs/3c.gif');
-  });
-
-  test('getNewspaperFrequencyRank', () {
-    final result = getNewspaperFrequencyRank(kanjiPage);
-    expect(result, 16);
-  });
-
-  test('parseKanjiPageData', () {
-    final result = parseKanjiPageData(kanjiPage, '時');
-
-    final expectedResult = KanjiResult();
-    expectedResult.query = '時';
-    expectedResult.found = true;
-    expectedResult.taughtIn = 'grade 2';
-    expectedResult.jlptLevel = 'N5';
-    expectedResult.newspaperFrequencyRank = 16;
-    expectedResult.strokeCount = 10;
-    expectedResult.meaning = 'time, hour';
-    expectedResult.kunyomi = ['とき', '-どき'];
-    expectedResult.onyomi = ['ジ'];
-    expectedResult.onyomiExamples = 
-    [
-      YomiExample(
-        example: '時',
-        reading: 'ジ',
-        meaning: '''hour, o'clock, (specified) time, when ..., during ...'''
-      ),
-      YomiExample(
-        example: '時価',
-        reading: 'ジカ',
-        meaning: 'current value, price, market value'
-      ),
-      YomiExample(
-        example: '零時',
-        reading: 'レイジ',
-        meaning: '''twelve o'clock, midnight, noon'''
-      ),
-      YomiExample(
-        example: '平時',
-        reading: 'ヘイジ',
-        meaning: 'peacetime, time of peace, ordinary times, normal times'
-      ),
-    ];
-    expectedResult.kunyomiExamples = 
-    [
-      YomiExample(
-        example: '時',
-        reading: 'とき',
-        meaning: 'time, hour, moment, occasion, case, chance, opportunity, season, the times, the age, the day, tense'
-      ),
-      YomiExample(
-        example: '時折',
-        reading: 'ときおり',
-        meaning: 'sometimes'
-      ),
-      YomiExample(
-        example: '切り替え時',
-        reading: 'きりかえとき',
-        meaning: 'time to switch over, response time'
-      ),
-      YomiExample(
-        example: '逢魔が時',
-        reading: 'おうまがとき',
-        meaning: '''twilight, time for disasters (similar to 'the witching hour' but not midnight)'''
-      ),
-    ];
-    expectedResult.radical = 
-    Radical(
-      symbol: '日',
-      meaning: 'sun, day'
-    );
-    expectedResult.parts = ['土', '寸', '日'];
-    expectedResult.strokeOrderDiagramUri = 'https://classic.jisho.org/static/images/stroke_diagrams/26178_frames.png';
-    expectedResult.strokeOrderSvgUri = 'https://d1w6u4xc3l95km.cloudfront.net/kanji-2015-03/06642.svg';
-    expectedResult.strokeOrderGifUri = 'https://raw.githubusercontent.com/mistval/kanji_images/master/gifs/6642.gif';
-    expectedResult.uri = 'https://jisho.org/search/%E6%99%82%23kanji';
-
-    expect(
-      json.encode(result),
-      json.encode(expectedResult)
-      );
-  });
-
-  /* KANJI SEARCH FUNCTION TESTS END */
-
-}
--- a/test/unofficial_jisho_api_test.dart
+++ b/test/unofficial_jisho_api_test.dart
@ -3,7 +3,6 @@ import 'package:path/path.dart' as path;
 import 'dart:convert';

 import 'package:unofficial_jisho_api/unofficial_jisho_api.dart';
-import 'local_function_test_cases.dart' show test_local_functions;
 import 'package:test/test.dart';

 final jisho = JishoApi();
@ -26,11 +25,7 @@ void runTestCases(List<String> testCaseFiles, Function apiFunction) async {
 }

 void main() async {
-
-  await test_local_functions();
-
  await runTestCases(getFilePaths('kanji_test_cases'), jisho.searchForKanji);
  await runTestCases(getFilePaths('example_test_cases'), jisho.searchForExamples);
  await runTestCases(getFilePaths('phrase_scrape_test_cases'), jisho.scrapeForPhrase);
-
 }