20/04/2015

Detalls de la nova release de SaltOS (r7680)

MariaDB, Google, Tesseract, New release

Josep Sanz, Jordi Company, Andres Díaz

Aquesta nova release apareix després de gairebé 2 anys de treball i com sempre, també aporta noves funcionalitats com les que es descriuen a continuació:

Correcció d'errors:

Com sempre, una nova release, ha de corregir els errors detectats, tant pels desenvolupadors com per part dels usuaris.

Actualització de les llibreries de tercers:

També s'han actualitzat a les últimes versions totes les llibreries de tercers per tenir el codi el més actual possible i sobretot, lliure de fallades de seguretat, en la mesura del possible.

Processament de text mitjançant el motor de OCR Tesseract:

Aquesta prestació permet SaltOS obtenir textos de les imatges i indexar a la base de dades per millorar la qualitat de les cerques. Per a això, SaltOS fa servir el projecte Tesseract (https://code.google.com/p/tesseract-ocr/ i http://es.wikipedia.org/wiki/Tesseract_OCR) el qual va ser alliberat com a codi obert en l'any 2005 per Hewlett Packard i la Universitat de Nevada, Las Vegas. Tesseract és desenvolupat actualment per Google i distribuït sota la llicència Apache, versió 2.0.

SaltOS, a més, aplica correccions sobre els resultats per poder obtenir textos de les pàgines i així, poder processar factures, albarans i altres documents que es poden processar com llistats de productes, detalls de factures o albarans o tot el que els integradors de SaltOS necessitin .

S'ha millorat el cercador de SaltOS:

El nou cercador de SaltOS ara incorpora dos tipus de consultes: en tot SaltOS o en tots els fitxers. Això permet buscar el que es desitgi en tots els registres de tota la base de dades o en tots els continguts de tots els fitxers que hagi processat SaltOS.

Per a això, SaltOS es recolza en un motor anomenat Mroonga (Fast fulltext motor de cerca). Aquest motor de cerca, permet a SaltOS aconseguir uns temps de resposta de l'ordre de 100ms, en lloc dels anteriors n segons que podia trigar a retornar resultats. Per poder utilitzar aquesta prestació, n'hi haurà prou amb usar MariaDB a partir de la seva versió 10.0.15 (https://mariadb.com/kb/en/mariadb/about-mroonga/), o utilitzar la imatge de CentOS que distribuïm amb tot el sistema pre-instal lat i pre-configurat (http://download.saltos.org).

Actualització a l'API v3 de Google:

Com ja es va comentar en un post anterior, a principis de gener, la sincronització de l'agenda de SaltOS amb Google Calendar deixo de funcionar després del tancament del servei mitjançant les APIs antigues, de manera que es va haver de fer l'I + D necessari per poder actualitzar el codi d'accés a Google Calendar i així, poder tornar a tenir en funcionament aquesta prestació tan usada de SaltOS. Una de les coses que es va haver de fer també és investigar com aconseguir el token d'autenticació sense haver de posar l'usuari ni clau de forma manual en el login de Google, encara que qui vulgui més detalls d'aquesta història, que miri el post Accés (login) transparent mitjançant l'API v3 de Google

Nova documentació de SaltOS

Després de diversos intents de fer una documentació d'usuari per SaltOS, Jordi Company, s'ha posat mans a l'obra i ha fet el gran pas de dotar totes les aplicacions de SaltOS de la seva corresponent User Manual. El procés d'escriptura s'ha fet usant el format T2T, que mitjançant txt2tags (http://txt2tags.org/) permet obtenir codi LaTeX i HTML, ideals per generar els fitxers DPFs i per integrar-lo en la nostra web. Per més info:


Línies de XML
60,895
Línies de PHP
18,637
Línies de JS
11,611
Línies de XSLT
2,498
Línies de CSV
1,919
Línies de CSS
577