<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
Anna,
<div class=""><br class="">
</div>
<div class="">My sympathies are with you concerning setting up Tesseract and Audiveris. It seems a bit arcane.</div>
<div class=""><br class="">
</div>
<div class="">What I did was to install tesseract via VietOCR3, which was developed to recognise Vietnamese script. </div>
<div class=""><span class="Apple-tab-span" style="white-space:pre"></span><a href="https://sourceforge.net/projects/vietocr/" class="">https://sourceforge.net/projects/vietocr/</a></div>
<div class=""><br class="">
</div>
<div class="">My tesseract setup (v. 4.1.1) is now somewhat strange:</div>
<div class=""><br class="">
</div>
<div class="">
<blockquote type="cite" class="">
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">timc$ tesseract --list-langs</span></div>
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">Error opening data file /Users/timc/Documents/ocr/VietOCR3/tesseract-ocr/eng.traineddata</span></div>
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.</span></div>
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">Failed loading language 'eng'</span></div>
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">Tesseract couldn't load any languages!</span></div>
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">List of available languages (5):</span></div>
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">tessdata/deu</span></div>
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">tessdata/eng</span></div>
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">tessdata/lat</span></div>
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">tessdata/osd</span></div>
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">tessdata/vie</span></div>
</blockquote>
<br class="">
<div>
<blockquote type="cite" class="">
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">timc$ echo $TESSDATA_PREFIX</span></div>
<div style="margin: 0px; font-stretch: normal; font-size: 11px; line-height: normal; font-family: Menlo;" class="">
<span style="font-variant-ligatures: no-common-ligatures" class="">/Users/timc/Documents/ocr/VietOCR3/tesseract-ocr/</span></div>
</blockquote>
<div><br class="">
</div>
<div>If this doesn’t help (and it hardly counts as useful instructions, I admit) I have found the main developer of Audiveris (Hervé Bitteur - <a href="mailto:herve.bitteur@audiveris.com" class="">herve.bitteur@audiveris.com</a> ) extremely responsive and helpful
 in the past. I suspect the same may be true of the developer of VietOCR3, Quan Ngueyen - <a href="https://sourceforge.net/u/nguyenq/profile/" class="">https://sourceforge.net/u/nguyenq/profile/</a> , though you will have to contact him/her through SourceForge.</div>
<div><br class="">
</div>
<div>Another admission: I haven’t done anything with this for a year or two. My idea was to set up a system which would take output data from Aruspix concerning location of bits of text, especially lyrics, and feed them as tiny tasks to Tesseract, then merge
 the recognised lyrics appropriately into the Aruspix MEI. As you might imagine, this is one of those projects that seems a lot simpler before you start, and I only got to the stage of recognising some ‘lyrics’ from 16c motets as text which I was (sometimes)
 able to identify using *very* approximate matching and a certain amount of manual guesswork with the Liber Usualis. </div>
<div>BTW all this was without any training for the fonts, styles, abbreviations and strange text-glyphs you find in 16c prints.</div>
<div><br class="">
</div>
<div>I think this is a valid Special Interest Sub-group idea for MEI, as it really is the next thing that is needed for corpus-building in early music.</div>
<div><br class="">
</div>
<div>Also, BTW, with a working tesseract installation, Audiveris does a pretty fair job with lyrics in ‘normal’ music.</div>
<div><br class="">
</div>
<div>Tim</div>
<div><br class="">
</div>
<div class="">Prof. Tim Crawford
<div></div>
<div class="">Professorial Research Fellow in Computational Musicology</div>
<div class="">Department of Computing</div>
<div class="">Goldsmiths College</div>
<div class="">London SE14 6NW</div>
<div class="">U.K.</div>
<div class=""><br class="">
</div>
<div class=""><a href="mailto:t.crawford@gold.ac.uk" class="">t.crawford@gold.ac.uk</a></div>
<div class=""><br class="">
</div>
</div>
<blockquote type="cite" class="">
<div class="">On 21 Mar 2020, at 14:05, Kijas, Anna E <<a href="mailto:Anna.Kijas@tufts.edu" class="">Anna.Kijas@tufts.edu</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div class="WordSection1" style="page: WordSection1; caret-color: rgb(0, 0, 0); font-family: GillSans; font-size: 18px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;">
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class="">Hello all,<span class="Apple-converted-space"> </span><o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class=""><o:p class=""> </o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class="">I hope that everyone is doing well during this public health crisis. As I am stuck at home for the unforeseeable future I have a bit more time (no more driving to work!). I wanted to build and test out the Audiveris engine
 on my own machine to see if I can process sheet music and use the OMR to extract musicXML. Has anyone worked or is working with the Audiveris engine to extract music notation? Here is the link to the development guide:<a href="https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fbacchushlg.gitbooks.io%2Faudiveris-5-1%2Fcontent%2Finstall%2Fsources.html&data=01%7C01%7Ct.crawford%40gold.ac.uk%7C74d46595e98147adccee08d7cda0ffe8%7C0d431f3f20c1461c958a46b29d4e021b%7C0&sdata=DF5eIMYuf4fQGywtMZt8icBq7lSLjqr3qCNf%2Bm%2BsskA%3D&reserved=0" originalsrc="https://bacchushlg.gitbooks.io/audiveris-5-1/content/install/sources.html" shash="TMM0jPyMerFGalXyWqVfaqbOvsIcb+x5msLqrCnxof8UGhpIsuZ8MsfsNZZv29MIpMaV0Ke40elKzmKbsjo83ZOAoSbs4o/7zr/BTpjBmNAG4MAYgukurVFmV+3wTCU+1ZSIie3BamwHWf/wj4X6OCtOQzz7hR6vbOXKJqDKuYA=" style="color: rgb(5, 99, 193); text-decoration: underline;" class="">https://bacchushlg.gitbooks.io/audiveris-5-1/content/install/sources.html</a>.<span class="Apple-converted-space"> </span><o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class=""><o:p class=""> </o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class="">I have built the engine on my machine and have installed the dependencies (JDK 8, Git, Tesseract, FreeType Library), but I am running into an issue with Tesseract. The Audiveris engine requires that you use Tesseract
 3.04 language data instead of 4.0 (it won’t work with the newer version). I installed Tesseract on my machine, but when I add the 3.04 language data it doesn’t see it and I keep getting the following error messages, which I believe are because I don’t have
 Tesseract set up correctly and/or the right version language files.<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class=""><o:p class=""> </o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class="">2020-03-21 10:00:33,027 WARN  [IMSLP273329]            TesseractOrder 166  | Could not initialize Tesseract with lang deu+eng+fra<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class="">2020-03-21 10:00:33,031 WARN  [IMSLP273329]                 SheetStub 845  | Error in performing [SCALE, GRID, HEADERS, STEM_SEEDS, BEAMS, LEDGERS, HEADS, STEMS, REDUCTION, CUE_BEAMS, TEXTS, MEASURES, CHORDS, CURVES,
 SYMBOLS, LINKS, RHYTHMS, PAGE] java.util.concurrent.ExecutionException: java.lang.NullPointerException<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class="">java.util.concurrent.ExecutionException: java.lang.NullPointerException<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class=""><o:p class=""> </o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class="">If anyone is able to provide some assistance, please let me know.<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class=""><o:p class=""> </o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class="">Thanks!<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class="">Anna<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class=""><o:p class=""> </o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<b class=""><i class=""><span style="font-size: 10.5pt;" class="">Please note:</span></i></b><i class=""><span style="font-size: 10.5pt;" class="">  Lilly Music Library librarian & staff are working remotely, beginning March 13, 2020,<span class="Apple-converted-space"> </span><a href="https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fcoronavirus.tufts.edu%2F&data=01%7C01%7Ct.crawford%40gold.ac.uk%7C74d46595e98147adccee08d7cda0ffe8%7C0d431f3f20c1461c958a46b29d4e021b%7C0&sdata=h7M2RIz6d363l3JtetOORNlJ%2FujRw%2BVlT4edl9W6TIo%3D&reserved=0" originalsrc="https://coronavirus.tufts.edu/" shash="j5AlEXT0KeeyhUqPnAXoRsItq56rgy4de7fJA2houvT2I22wS+0i8jkH5yW/Efj/XlCM6RgnNK5fYMlMzQ8TvIEvqPkdnpnr3p4et+o9CX0biWPTWbskdHEBZYKxtmnQ7fVzObZZ1XJYnCHR7zzYuY1u7g7Dre6EsGyFky+bOGA=" style="color: rgb(5, 99, 193); text-decoration: underline;" class=""><span style="color: rgb(5, 99, 193);" class="">because
 of COVID-19</span></a>. Information about library services and support available during this time is available<span class="Apple-converted-space"> </span><a href="https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Ftischlibrary.tufts.edu%2F&data=01%7C01%7Ct.crawford%40gold.ac.uk%7C74d46595e98147adccee08d7cda0ffe8%7C0d431f3f20c1461c958a46b29d4e021b%7C0&sdata=Z%2Fe4Al5jaCI2cSbyeudnZLMJXsFYzxYlqkGvBxnIS08%3D&reserved=0" originalsrc="https://tischlibrary.tufts.edu/" shash="xKe83XebyYDMiKcT0sqXbioNRKzR/pAXJt5/WiUhNHFhOdtgwyUedPUS0ThyvjpWRpyQW9QLDDLZBO7ox1RqRTKmJHVDNFURXBYUm3saeTVj7gSBu/KI6ExKNR3cVXyNISKoYnM7m5CLdJPBdPf97dT1shwgs6YSpcjeIBmjr0A=" style="color: rgb(5, 99, 193); text-decoration: underline;" class=""><span style="color: rgb(5, 99, 193);" class="">here</span></a>.
 Meetings and consultations will be conducted over Zoom.<o:p class=""></o:p></span></i></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class=""><o:p class=""> </o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 11pt;" class="">Anna Kijas<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 10pt;" class="">Head, Lilly Music Library<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 10pt;" class="">Granoff Music Center<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 10pt;" class="">Tufts University<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 10pt;" class="">20 Talbot Avenue, Medford, MA 02155<o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 10pt;" class="">Pronouns: she, her, hers</span><span style="font-size: 10pt;" class=""><o:p class=""></o:p></span></div>
<div style="margin: 0in 0in 0.0001pt; font-size: 12pt; font-family: Calibri, sans-serif;" class="">
<span style="font-size: 10pt;" class=""><a href="https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Ftufts.libcal.com%2Fappointments%2Fkijas%2Flilly&data=01%7C01%7Ct.crawford%40gold.ac.uk%7C74d46595e98147adccee08d7cda0ffe8%7C0d431f3f20c1461c958a46b29d4e021b%7C0&sdata=zbd%2Bjc04ZqzG4OfAprx7hTa%2FvWI6iRejgVCy9n6%2Fk3o%3D&reserved=0" originalsrc="https://tufts.libcal.com/appointments/kijas/lilly" shash="H6XAoG/w6KNdFlHmWvV1Ho1g1wsU/ib+i+oz/xSsBGJ7rBRmsD1nQEBPtMS4mVdjANS+02H6G3m3otuHNwC5S9hPl9JdsSxyrwqzBGR49wvb2zBuGx+IVjR7lgsE2rheM7XQe2Ie+Jx4LKr1SZtky+x0lrbB9ij+K4L/RUQ5yL0=" style="color: rgb(5, 99, 193); text-decoration: underline;" class=""><span style="color: rgb(5, 99, 193);" class="">Book
 an appointment</span></a><span class="Apple-converted-space"> </span>| (617) 627-2846</span><o:p class=""></o:p></div>
</div>
<span style="caret-color: rgb(0, 0, 0); font-family: GillSans; font-size: 18px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">_______________________________________________</span><br style="caret-color: rgb(0, 0, 0); font-family: GillSans; font-size: 18px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class="">
<span style="caret-color: rgb(0, 0, 0); font-family: GillSans; font-size: 18px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">mei-l
 mailing list</span><br style="caret-color: rgb(0, 0, 0); font-family: GillSans; font-size: 18px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class="">
<a href="mailto:mei-l@lists.uni-paderborn.de" style="color: rgb(5, 99, 193); text-decoration: underline; font-family: GillSans; font-size: 18px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" class="">mei-l@lists.uni-paderborn.de</a><br style="caret-color: rgb(0, 0, 0); font-family: GillSans; font-size: 18px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class="">
<a href="https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Flists.uni-paderborn.de%2Fmailman%2Flistinfo%2Fmei-l&amp;data=01%7C01%7Ct.crawford%40gold.ac.uk%7C74d46595e98147adccee08d7cda0ffe8%7C0d431f3f20c1461c958a46b29d4e021b%7C0&amp;sdata=qzl2Zy1gk%2FcFbWKmdSfU0q06osWZ1W1jZCzg5zyiaDI%3D&amp;reserved=0" style="color: rgb(5, 99, 193); text-decoration: underline; font-family: GillSans; font-size: 18px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" class="">https://eur01.safelinks.protection.outlook.com/?url=https%3A%2F%2Flists.uni-paderborn.de%2Fmailman%2Flistinfo%2Fmei-l&amp;data=01%7C01%7Ct.crawford%40gold.ac.uk%7C74d46595e98147adccee08d7cda0ffe8%7C0d431f3f20c1461c958a46b29d4e021b%7C0&amp;sdata=qzl2Zy1gk%2FcFbWKmdSfU0q06osWZ1W1jZCzg5zyiaDI%3D&amp;reserved=0</a></div>
</blockquote>
</div>
<br class="">
</div>
</body>
</html>