Kultura

Alnag
15.6.2009 09:03
Technická diskuse...

problémy, bugy, přání, stížnosti atp.

informace o webu
Pravidla (OT, moderování, chování atp.)

Přehled ročníkových článkových "auditů"

V případě problému s něčím prosím rovnou pište i přístroj, OS a prohlížeč (např. PC, Win 8, Chrome 39 nebo Samsung Galaxy S2, Android KitKat 4.1, Opera)
26.4.2013 09:10 - alef0
sirienove poziadavky + tempo vyvoja na kostke + pocet userov ktori to pouziju => nerealne

co takto si stiahnut readability? rozsirenie pre firefox + chrome

vysledok vyzera takto

http://www.readability.com/articles/2fmghhll

ctrl-c, ctrl-v do wordu, ulozit ako pdf
26.4.2013 09:13 - Colombo
alef0: s copy-paste si di někam

assasin: to je cool, to je hodně cool. Vzhledem TeXovskému výstupu se s tím dají dělat různé super kejkle. Třeba automaticky-generovaný sborník:) Co obrázky atp., funguje to v tom?
26.4.2013 09:53 - alef0
co *presne* je na ctrl-c, ctrl-v zle?

ten latex je of course skvely, ale integrovat do do kostky: vela zdaru, hlavne pri hore spomenutom tempe vyvoja integrovat s php, nom nom nom

na pdf + php tuto nejaky clovek odporuca: http://www.mpdf1.com/mpdf/index.php

srsly, ak si user, alternativne si mozes nainstalovat virtualnu pdf tlaciaren: http://www.pdf995.com/

tlacis rovno z browsera do pdf, easy as goblin pie
26.4.2013 15:14 - Assassin
Ten můj skript není nijak závyslej na tom, v čem je kostka napsaná, řeší jen HTML výstup stránky. Dokonce ani není nutný ho mít integrovaný v kostce, může si běžet na externím serveru a dělat si PDFka. Pokud by se kostka změnila (skripty, CSS), ale HTML struktura samotných článků by zůstala stejná, tak skript pořád pojede. Pokud by se změnila HTML struktura, byly by potřeba nějaký minoritní změny.

alef0 píše:
sirienove poziadavky + tempo vyvoja na kostke + pocet userov ktori to pouziju => nerealne

Obtížné na počkání, nereálné do tří dnů...můžes prosím konkretizovat přesně ten nemožný bod, na kterým si myslíš, že by se to všechno seklo?

Colombo píše:
Co obrázky atp., funguje to v tom?

No včera narychlo jsem tam naházel jen základní formátování textu a seznamy, musely by se dodělat obrázky, tabulky atd., ale nevidím na tom nic obtížnýho, jen by to byla piplačka s regulárními výrazy.

alef0 píše:
readability

Tohle se mi třeba taky celkem líbí:)

Jinak přestože si obhajuju, že by to šlo, včetně sirienových požadavků, otázka je, zda by se to skutečně využilo a zda má vůbec smysl nad tím trávit ten čas.
26.4.2013 15:46 - Colombo
Assassin: Umíš v LaTeXu? Sir Thomas navrhl, že kdyby někdo uměl v LaTeXu na takové té vyšší úrovni (tedy ty věci, co jsou níže), bylo by zajímavé udělat documentstyle d20 (když tak přemýšlím, ono by to možná zas tak složité ani nebylo) a upravit formátování tak, ať to vypadá pěkně.

Potom, vzhledem k tomu, že člověk dostane pomocí tvého scriptu LaTeXový soubor, který dále může upravovat, při dobrém předzpracování by se pak jen vyřešily detaily a mohl by se vydat npř. sborník.

Imho, já bych si třeba svoje články v nějakém lepším formátu i zazálohoval. Takže podle mě to i smysl má.
26.4.2013 15:46 - alef0
latex a integracia> musis spustat shell skript, ten ti moze zdochnut, moze zozrat cele cpu, plus na sharovanom hostingu je to mozno az nemozne

imho ta druha pdf library je viac ok, nemusis sa drbat s latexom

ale je to skvele cvicenie na integraciu medzi php a pdf
26.4.2013 17:07 - Assassin
alef0 píše:
musis spustat shell skript, ten ti moze zdochnut, moze zozrat cele cpu, plus na sharovanom hostingu je to mozno az nemozne

Ano, nad tím jsem taky uvažoval. Nepsal jsem to z toho důvodu, že by to stejně bylo napřed potřeba probrat s někým, kdo přesně ví, co hosting kostky umožňuje.

Ale myslím, že v případě nouze by šlo generovat jen .tex soubory a pak je externě někde hromadně přeložit, uploadnout a dávat odkaz na ně. Myslím, že drtivá většina článků v PDF by měla kolem 100 kB a dneska už pár giga prostoru není žádnej problém.

Nebo teda používat nějakej externí online kompilátor, ale to už by nebylo tak čistý (cizí kompilátor) nebo by se to prodražilo (pronájem serveru)

alef0 píše:
imho ta druha pdf library je viac ok, nemusis sa drbat s latexom

Je možné, že by to bylo efektivnější řešení, ale do toho nevidím a nevím, jak moc dobře by se v tom dala řešit typografie článků.

Colombo píše:
Umíš v LaTeXu?

Jen uživatelsky. Myslím, že na vytvoření typograficky kvalitního dokumentu není potřeba si vytvářet nějaký vlastní styly. Maximálně tam vysázet logo D20 a hotovo.
26.4.2013 17:24 - alef0
online latex->pdf je ako vravim pain in the arse, hlavne kvoli tym externym procesom, mne sa stalo ze raz prisiel google bot a pwnol server.

ta druha kniznica nevola externe procesy, je to ale 1mb php skript

ak chces offline generovanie, nechaj si dumpnut databazu, za dve minuty napises mysql->latex konverzny skript a dalsi tyzden budes rucne opravovat bugy v clankoch, lebo kreativita editorov je nekonecna, ale mas pdfka, ktore vyhodis na server a obides vsetky hrozy
26.4.2013 18:11 - sirien
alef0: Pokud sis nevšiml, tak se nacházíš v diskusi věnované běžné správě kostky a veřejné diskusi nad návrhy a případně (zrovna teď) vývojem. Opravdu bych ocenil, kdyby sis na tomhle místě odpustil své obvyklé jízlivosti a zůstal u věcných sdělení.

Assassin píše:
Jinak přestože si obhajuju, že by to šlo, včetně sirienových požadavků, otázka je, zda by se to skutečně využilo a zda má vůbec smysl nad tím trávit ten čas.

Jsem docela přesvědčený, že ano. Spousta místních článků by si o to takřka říkala, Sborníky ("manuálně" vytvořené soubory několika článků na podobné téma hozené do PDF) měly svého času poměrně dobrý ohlas a už mnohkrát se mi stalo, že jsem byl někým požádán zda taková možnost je a musel jsem ho/jí odmítnout

Assassin píše:
že by to stejně bylo napřed potřeba probrat s někým, kdo přesně ví, co hosting kostky umožňuje

Max je teď ještě nějakou dobu (~týdny) nedostupnej, až se vrátí zpátky tak se ho dá snadno zeptat
26.4.2013 18:31 - alef0
sirien, draga baratom, vsak v kazdom linku mam jeden napad, tak uz neviem O_0

ok uz len berem pukance a tesim sa co z toho vypadne
26.4.2013 19:18 - Colombo
Zajímavý by byl i tiskem vydaný menší promo sborník "x let kostky"
26.4.2013 19:55 - pipux
@alef0: ta readability.com vypadá dobře, díky za tip (nevěděl jsem).
Jinak, souhlasím s tebou ve skepticismu k přímému html -> pdf řešení (důvody proč již padly, nebudu opakovat). Mluvíš ze zkušenosti.

Z implementačního hlediska jde jen o zajištění adekvátního vstupu a výstupu:
1. Zajistit jednoznačně určený (bez chyb parsovatelný) počáteční (meta)formát. Když se toto udělá pořádně, v následujícím kroku půjde nasadit algoritmy s minimální složitostí a chybovostí.
2. Převést na libovolný výstup, dle libosti a vhodnosti (PDF, PostScript, TeX, OfficeOpenXML, XPS, svíčková s knedlíky ...)

Ten první bod může být problematický, protože:
Současný editor článků je zlo (způsob formátování není transparentní -> způsob, jak si zajistit potenciálně nekonzistentní vstup).
+
Dukolm píše:
Dále, což je ten horší problém, se tu vyskytují články se styly v HTML atributu style což ti zvládne dost znepříjemnit život a jakou cokoliv práci s nimi. A jejich odstranění naruší obvykle strukturu článku.

Je toto pravdivé? Pokud ano, jak zasažené články převést do jednoznačné podoby?
Asi regulárními výrazy se zásobníkem ... a pokud tyto články se style tagem psali lidé, bude asi nutné jejich převody krom robustního převaděče dodatečně ručně zkontrolovat.

Mj. podotýkám, že vnitřnosti kostky jsou pro většinu z nás jen černou schránkou (jediný, kdo zná vnitřní architekturu bude zřejmě právě nedostupný Max). Nebudu tady dále vynášet žádné "chytré" závěry, byl bych za blábolícího idiota. I něco z předchozích postřehů může být dosti mimo.

@Assassin: řešíš tu převádění na výstup, a vypadá to slibně. Teď ještě ošéfovat ten vstup.
Až budeš s html>tex>pdf převaděčem hotov, podělíš se o zdrojový kód?
26.4.2013 22:34 - Dukolm
pipux: jede o to, že staré články jsou v XHTML a nové v různých podobách protože kostka podporuje více vstupů než jen wysiwyg nebo čisté HTML(které se vyskytuje jako ručně psané, pak různé exporty html z jiných editorů Open Office,Word,...) a pak se tu dá snad prý i publikovat přes nějaký udělátko z MS Office
Kostka tě neomezuje ve formátu při publikování což je rozhodně správně ale jakákoliv pozdější práce s články není bezproblémová. Zvláště s těmi co jsou z různých Office, tam sou ty regulérní výrazy doslova peklo.

Alef0: mPDF už se zlepšilo od posledního seznámení sním já jsem se pokoušel to realizovat přes TCPdf.

Na Latexu se mi líbí to že pokud bude me mít tex soubor tak už je pak i jednduší přidávání dalších formátů epub a mobi třeba.

Jinak jsme se už o začátku přikláněly k metodě generování externě nebo při publikaci článku ne na klik uživatele protože to ti zvládne zaměstnat server i ten TCPdf,...

Největším problémem vlastního nasazení latexu na server bych viděl v tom že webové servery ne vždy mají potřebné grafické knihovny kuli zpracování obrázků dost s tím zápasily firmy co generují e-knihy přes Calibre na servru...
26.4.2013 23:39 - Colombo
Píše:
Kostka tě neomezuje ve formátu při publikování

S tímhle bych tak úplně nesouhlasil:P
27.4.2013 12:17 - sirien
Pokud se pamatuji správně Maxovy výklady, tak s tou jednotností článků by to nemělo být tak zlé - každý článek tu existuje dvakrát:
- jednou ve zdrojové podobě (tj. v té, ve které jste ho napsali - a ta může být různá v závislosti na tom zda jste psali přímo HTML, ve WSW, v MSO, OO, LiveWriteru...)
- a pak v koncové podobě (tj. v té, která se zobrazuje).

Pokaždé, když se uloží zdrojová podoba, Kostka podle ní vygeneruje adekvátní koncovou podobu. A ty už by snad měly být v podstatě shodné.
Doufám. Pokud jsem to teď teda nějak hrozně nezmotal.
27.4.2013 18:41 - pipux
@sirien: tak nějak to snad i bude. Možná tak dva roky nazpět se něco takového probíralo - jak říkáš.

Co se implementace týče...
A) Ty chceš stáhnutelné pdf na jedno kliknutí (tj. pdf se kompilující spolu s uveřejněním/upravením článku).

B) Svým předch. příspěvkem jsem (asi nevědomě/nepochopením) vnesl trochu zmatku, a to skrytým lobbováním za obecnou exportní funkci na kliknutí, na níž by se dalo naroubovat už ledacos. Principiálně nějak takto:


C) Ještě se tu ozvaly další hlasy, které by si přály řetězový export více článků do jednoho výstupu. Toto řešení by si asi pak vyžádalo nějaký samoobslužný automat (vybereš si ze seznamu dle kategorií články, které chceš exportovat, seřadíš dle kýženého pořadí, a exportuješ ...)

- - -

Takže určitě promyslet - nemá cenu dělat jednu věc natřikrát.
27.4.2013 18:57 - Colombo
pipux:
V momentě, kdy existuje TeXovský soubor pro článek, není problém je dále upravovat. Tedy apriori žádný řetězový export nebyl vyžadován, ale fakticky to v případě TeXovského výstupu pro každý článek není problém spojit.
27.4.2013 20:55 - pipux
@colombo: že chceš řetězový export, to jsi skutečně neřekl. Mj. ses ale vyslovil proti ruční copy&paste metodě.
S ohledem na #1550 a #1549 nerozumím, co chceš. Jestliže copy&paste do Wordu není ok, ale copy&paste do texového zdrojáku najednou je ok, z urč. úhlu pohledu si to protiřečí.
Nicméně, vzdušné zámky (ať ty mé či ty tvé) nejsou podstatné; důležité je najít řešení vhodné pro množinu koncových uživatelů.

Co se automatu na zřetězování týče, stále může jít o zbytečný, těžkopádný nástroj, jinak ospravedlnitelný jen vhodností používání. Ono je rozdíl, jestli budeš chtít běžně spojovat dva, tři, čtyři, anebo padesát článků.
27.4.2013 23:20 - sirien
.pdf je primární cílová podoba. Jakékoliv jiné formáty vidím jako bonus.

Každopádně si popravdě nejsem úplně jistý jak moc je vhodné mít jako koncové médium něco snadno přepisovatelného (.doc .txt aj.) - nějak se mi úplně nezdá představa toho že by se výsledek dal tak snadno šířit v tak snadno upravovatelné podobě bez souhlasu autorů... :/
I když ono zase takový rozdíl by to možná nebyl...
27.4.2013 23:33 - York
sirien píše:
nějak se mi úplně nezdá představa toho že by se výsledek dal tak snadno šířit v tak snadno upravovatelné podobě bez souhlasu autorů... :/
I když ono zase takový rozdíl by to možná nebyl...


Rozdíl by to byl jen v případě, že bys z toho nejdřív udělal bitmapu a tu pak vložil do výsledného pdf, potom by z toho text nešel dostat jinak, než OCRkem nebo ručním přepsáním. Na pdf obsahující textovou vrstvu existují volně dostupné editory.

Když by si ale ten text chtěl někdo zkopírovat a upravit, tak to může snadno udělat přímo z kostky, takže moc nevidím smysl to nějak cíleně ztěžovat u případného pdf exportu.

Pro přispívání do diskuse se musíš přihlásit (zapomenuté heslo). Pokud účet nemáš, registrace trvá půl minuty a 5 kliknutí.

Věděli jste, že...
Na d20.cz můžete mít svůj vlastní blog. Pokud chcete napsat o nečem, co alespoň vzdáleně souvisí s RPG, můžete k tomu využít našeho serveru. Tak proč chodit jinam? >> více <<
Jak se chovat v diskuzích
Přehled pravidel pro ty, kteří k životu pravidla potřebují. Pokud se umíte slušně chovat, číst to nemusíte. >> více <<
Formátování článků
Stručné shrnutí formátovacích značek zdejších článků, diskuzí, blogů a vůbec všeho. Základní životní nutnost. >> více <<
ČAS 0.067949056625366 secREMOTE_IP: 3.131.13.37