Catdoc - konverze dokument∙ MS Office do standardnφho k≤dovßnφ
25.9.2000
V souΦasnΘ dob∞ probφhß v linuxovΘ konferenci pom∞rn∞ vzru╣enß diskuse t²kajφcφ se pou╛itelnosti Linuxu
jako "kancelß°skΘho" operaΦnφho systΘmu a s tφm souvisejφcφho sdφlenφ dokument∙ mezi jednotliv²mi platformami.
N∞kte°φ u╛ivatelΘ tvrdφ, ╛e je Linux v tomto ohledu nepou╛iteln², jinφ zastßvajφ nßzor, ╛e Linux lze na prßci
s dokumenty i na ostatnφ kancelß°skΘ prßce velmi dob°e vyu╛φt. Tuto debatu nehodlßm na Wastelands rozebφrat,
ale rozhodl jsem se, ╛e i ve vlastnφm zßjmu si zmapuji situaci kolem tΘto problematiky a pokusφm se naznaΦit
mo╛nΘ cesty, jak tento problΘm °e╣it.
Nenφ tomu zase tak dlouho, co jsem zde psal o programu, kter² dokß╛e p°eΦφst a zobrazit dokumenty ve formßtu
MS Word. Jmenoval se Antiword a jeho jedin²m nedostatkem (doufßm, ╛e doΦasn²m) byla absence ΦeskΘ znakovΘ sady.
V dne╣nφm Φlßnku se podφvßme na velmi podobn² program, kter² v╣ak Φeskou znakovou sadu obsahuje a konverze
Φesk²ch dokument∙ tedy nenφ problΘmem.
Jmenuje se jednodu╣e Catdoc a op∞t se jednß o konvertor z formßtu .doc do ΦistΘho formßtovanΘho textu.
Druh²m progamem obsa╛en²m v instalaci programu je program se jmΘnem xls2csv. Jak nßzev napovφdß, jednß
se o konvertor formßtu MS Excel do souboru s hodnotami odd∞len²mi Φßrkami (comma separated values - .csv).
Tento formßt souboru dokß╛e naΦφst velkΘ mno╛stvφ aplikacφ jak v Linuxu, tak ve Windows. Domovskou strßnku
naleznete na adrese www.ice.ru/~vitus/catdoc/.
Jako obvykle je program t°eba p°elo╛it a naistalovat. PotΘ je mo╛nΘ jej pou╛φvat. Ob∞ aplikace jsou sice urΦeny
pro p°φkazovou °ßdku shellu, ale program catdoc obsahuje takΘ grafickΘ prost°edφ vytvo°enΘ v Tk/Tcl. Funkce je
samoz°ejm∞ stejnß.
Catdoc & Wordview
Nejd°φve se podφvßme na program Catdoc a jeho grafickΘ rozhrannφ Wordview. Po instalaci naleznete v cφlovΘm
adresß°i (implicitn∞ /usr·Local/bin) dva programy - catdoc a wordview. Syntaxe prvnφho z nich je nßsledujφcφ:
catdoc [-vlu8btawx] [-m number] [ -s charset] [ -d charset] [ -f output-format] file
V╣echny parametry nemß smysl popisovat, proto╛e jsou velmi podrobn∞ popsßny v dokumentaci. Je v╣ak vid∞t, ╛e
mßte mo╛nost definovat p°edev╣φm znakovou sadu zdrojovΘho a cφlovΘho souboru. A proto╛e program podporuje takΘ
v╣echny ΦeskΘ znakovΘ sady, nenφ problΘm p°evΘst soubor vytvo°en² ve Wordu v nestandardnφ znakovΘ sad∞
windows-1250 do sprßvnΘho a normovanΘho k≤dovßnφ ISO-8859-2, kterΘ m∙╛ete otev°φt v libovolnΘm textovΘm editoru
v Linuxu. Pokud mßte v oblib∞ rad╣i grafickΘ prost°edφ, staΦφ spustit program wordview a v n∞m si otev°φt
po╛adovan² soubor, vybrat vstupnφ a v²stupnφ k≤dovßnφ a znovu jej ulo╛it jako nov² soubor. Nev²hodou je, ╛e
grafickΘ prost°edφ neobsahuje v╣echny mo╛nosti °ßdkovΘho programu.
Standardnφm v²stupem programu je formßtovan² ASCII text. Aplikace navφc dokß╛e do textu vklßdat formßtovacφ
symboly sßzecφho systΘmu TEX. Tφm m∙╛ete z dokumentu Wordu zφskat vstup pro TEX a dßle jej upravovat.
xls2csv
Druhou Φßstφ instalace je program xls2csv, kter² slou╛φ ke konverzi dokument∙ MS Excel do souboru hodnot
odd∞len²ch Φßrkami. Tento formßt lze otev°φt ve v∞t╣in∞ program∙ v Linuxu. Pou╛itφ je stejnΘ jako u programu
Catdoc, xls2csv v╣ak neobsahuje grafickΘ prost°edφ a existuje pouze ve verzi pro p°φkazov² °ßdek.
Oba programy o kter²ch dnes byla °eΦ mohou b²t ΦßsteΦn²m °e╣enφm problΘmu p°evodu dokument∙ vytvo°en²ch v MS Office
do Linuxu. Nejd∙le╛itej╣φ vlastnostφ je podpora v╣ech Φesk²ch znakov²ch sad, kterß Φasto u podobn²ch program∙
chybφ. Pokud tedy pot°ebujete pracovat s dokumenty, kterΘ vytvo°ili va╣i kolegovΘ ve Windows na Linuxu, vyzkou╣ejte
sadu programu Catdoc.
|