Aktualizace 17.10.2024 - pokročilý webový crawler, vylepšená moje data a spousta dalších novinek
Deeply se změnilo na: pages/partials/navbar/imagealts.deeply_changes_to_editee Přečíst příběh

Aktualizace 17.10.2024 - pokročilý webový crawler, vylepšená moje data a spousta dalších novinek

Ondřej Barták
Ondřej Barták
Ondřej je programátor v Editee. Volnomyšlenkář, který všechen svůj čas věnuje programování, které je pro něj vším. Aplikaci Editee píše od počátku fungování.
Aktualizace 17.10.2024 - pokročilý webový crawler, vylepšená moje data a spousta dalších novinek

Dobrý den,

Dnes přinášíme větší aktualizaci Editee AI, na kterou jste někteří čekali.

Co je tedy nového?

Kromě opravy běžných UX a backendových chyb jsme vylepšili následovné:

 

Kompletní refaktor a vylepšení kódu u AI převodu audia na text

 

Převod nyní pracuje daleko rychleji (až o 80%), zejména u velmi dlouhých audio souborů.

Děkujeme uživatelům, kteří nám poskytli jejich několikahodinové nahrávky, na kterých jsme byli schopni vše odladit a vylepšit.

Taktéž jsme opravili chybu, kdy u velmi dlouhých audio souborů vznikla občasná chyba, kdy se výsledný text po přepisu nezobrazil.

I když se to stalo pouze v pár případech, podobná situace již nenastane.

Dále jsme vylepšili fungování zejména toho, kdy někdo z uživatelů nahrál soubor, kterému změnil příponu, například z wav na mp3. Tím náš server vyhodnotil, že se nejedná o validní audio soubor a požadavek před zpracováním zamítl.

Spolu s tímto jsem vytvořil “konvertor”, který kontroluje zda není soubor nekompletní či poškozený.

V některých případech se stávalo, že nám uživatelé nahrávali poškozené, částečně chybné audio soubory, díky čemuž AI model naše požadavky o přepis odmítal.

Takovéto soubory si nyní sami na pozadí opravujeme a optimalizujeme.

 

Vylepšený překladač

 

Částečně jsme taktéž přepsali překladač.

Zejména jsme přepsali validace a zefektivnili překlad dokumentů.

U překladače chystáme nové funkce jako třeba vlastní slovník.

 

Vylepšený obrázkový AI model Editee Inspire

 

Ve zkratce - Editee Inspire je nyní lepší, rychlejší a tvoří kvalitnější obrázky.

Dle našeho testování generuje zhruba 6x rychleji než předchozí verze a generuje daleko detailnější výstupy a taktéž lépe píše kratší text.

 

Vylepšená funkce Moje Data

 

Moje data je funkce, kterou jsme kompletně od základu přepsali a nadále na ní budeme pracovat.

Zlepšili jsme to, jak jsou tato data interpretována jazykovému modelu, díky tomu jim AI lépe rozumí, což se projeví zejména na kvalitě výstupů.

 

Přidali jsme pokročilý AI crawler webů

 

Doposud bylo možné nahrát jednotlivé stránky webu pouze po jednom.

Nyní stačí vložit www adresu webu a zaškrtnout: “Projít celý web”.

Náš software posléze projde celý Váš web a stáhne si obsah jednotlivých stránek.

Prozatím jsme tuto funkci limitovali na maximálně 1000 URL během jednoho crawlování.

Testovali jsme tuto funkci na spoustu způsobů a potřebujeme nasbírat data, jak vše bude fungovat, posléze pak limity zvýšíme.

Nutno podotknout, že mi tato funkce dala hodně zabrat.

Crawlování je v podstatě “celý IT obor” a je nutné překonat spoustu překážek.

Například pokud děláte více požadavků na jeden web, začnou Vás tzv. “Challengovat” anti-botové ochrany jako captcha, cloudflare WAF a mnoho dalších.

Povedlo se mnám vše optimalizovat tak, aby tyto ochrany nebyly překážkou a crawlování bylo úspěšné. 

Z desítek tisíc stránek, které jsem dnes testoval, Editee překonalo kompletně vše.

 

Nové formáty u nahrávání souborů

 

Doposud byl počet formátů souborů, které jste mohli nahrát, značně omezené. 

Pro mě asi největší výzvou bylo zpracování komplexních excel sheetů nebo třeba různé grafy v PDF/Word souborech, které tam byly vloženy jako obrázky.

To se vše povedlo překonat.

Nyní můžete do moje data nahrávat větší soubory (prozatím až 30 MB, ale po otestování v produkci a vyladění postupně navýšíme - až na stovky MB).

 

Nyní můžete nahrát tyto formáty souborů:

bmp, csv, doc, docx, eml, epub, heic, html, jpeg, png, md, msg, odt, org, p7s, pdf, png, ppt, pptx, rst, rtf, tiff, txt, tsv, xls, xlsx, xml

Editee nyní zpracuje i složitější excel soubory a taktéž přečte text na obrázcích v dokumentech a podobně.

Nejedná se tedy o jednoduché “stáhnutí” textu z dokumentu, nýbrž nad dokumentem jako celkem AI “přemýšlí” a vidí věci, které dříve ne.

Taktéž můžete text vyfotit telefonem, třeba leták, knížku nebo jakýkoliv jiný text (nyní vidíme a rozumíme i obrázkům).

Po dokončení úlohy crawlování vždy v Moje data uvidíte, jaké odkazy jsme stáhnuli a do Editee nahráli.

 

AI nyní zná soubory, které jste do Moje data nahráli

 

Dříve, když jste nahráli, třeba soubor nebo URL adresu, ačkoliv AI tato data znala, nebyla schopná říci, kde “k nim přišla” nebo kde čerpala.

To se nyní změnilo a AI dokáže, dle zadání, pracovat i se specifickým odkazem nebo souborem nahraným v “Moje data” a přesně ví, odkud data použitá k odpovědi, vzala.

 

 

To je dnes vše.

Nová vylepšení budeme sledovat a nadále vylepšovat.

Chystáme v následujících dnech a týdnech nové funkce, které máme dokončené nebo před dokončením (nové funkce v moje data, přepracovaný, vylepšený chat, zbrusu nové funkce a mnoho dalšího), vše velmi brzy oznámíme :).

Hezký den a díky moc, že jste s námi.

Vážíme si veškeré Vaší podpory.

 

Zpět na blog
Vyzkoušejte si aplikaci na umělou inteligenci zcela zdarma, Editee AI
Na co ještě čekáte? Objevte potenciál AI a buďte 10x produktivnější!
robot Editee ai logo Vyzkoušet Editee zdarma

Copyright 2024 Editee.com, všechna práva vyhrazena.

Editee je registrovaná ochranná známka společnosti Deeply AI Software s.r.o.

Tato webová stránka ukládá soubory cookies. Používáním této stránky s tímto vyjadřujete souhlas. Podrobnosti o účelu a rozsahu zpracování naleznete v odkazu Cookies v Důležitých informacích. Pokud s ukládáním nesouhlasíte, opusťte, prosím, stránku.