Textový soubor. Abstrakt: Textové soubory

Soubor(anglický soubor - pořadač) - pojem ve výpočetní technice: entita, která umožňuje přístup ke zdroji výpočetní systém a má řadu funkcí:

  • pevné jméno (posloupnost znaků, číslo nebo něco jiného, ​​co soubor jednoznačně charakterizuje);
  • určitou logickou reprezentaci a odpovídající operace čtení/zápisu.

Může to být cokoli - od sekvence bitů (ačkoli ji čteme po bytech, nebo spíše slovech-skupinách bajtů, čtyři, osm, šestnáct) až po databázi s libovolnou organizací nebo jakoukoli mezilehlou možností; vícerozměrná databáze, přísně uspořádaná.

První případ odpovídá operacím čtení / zápisu proudu a / nebo pole (to znamená sekvenční nebo s přístupem podle indexu), druhý - příkazy DBMS. Mezilehlé možnosti jsou čtení a analýza všech druhů formátů souborů.

(Z Wikipedie, otevřené encyklopedie)

Bože, to je nesmysl (© olivur77).

rozumíš něčemu? Já ne. Definice ve Wikipedii je samozřejmě s největší pravděpodobností správná, ale nedává žádné pochopení pro pouhé smrtelníky (jako jsem já).

Co je to soubor? Vysvětlení v normálním jazyce.

Dovolte mi to znovu vysvětlit na příkladech, co je soubor, a ten akademický výklad a hlavně překlad z angličtiny je nuda.

Přemýšleli jste někdy nad tím, proč kliknutím na „na malou fotografii“ () se otevře program (také soubor a někdy i několik souborů) pro prohlížení fotografií? Když klikneme na zástupce filmu (), spustí se program pro sledování filmu? Když klikneme na zástupce (mimochodem také soubor) pro bezplatnou komunikaci (například), otevře se program, podle kterého zdarma komunikujeme s přáteli a příbuznými a dokonce se vidíme?

proč se to děje? Pokud si myslíte, že operační systém Windows je tak chytrý, pak se hluboce mýlíte.

Chci vyvrátit mýtus o „chytrosti“ operačního systému Windows a lépe vás seznámit s takovými pojmy, jako je např. "Soubor", "přípona", "formát".

Na první pohled jsou to slova děsivá a nesrozumitelná, ale ve skutečnosti je vše docela jednoduché a brzy se o tom přesvědčíme.

Udělejme jedno nastavení (jak je znázorněno na obrázku níže), které nám pomůže porozumět těmto konceptům.

Stiskněte tlačítko "Start", vyberte "Ovládací panely" (pokud se chcete dozvědět více o tom, co to je, projděte). Pokud vaše zobrazení „Ovládacího panelu“ není stejné jako na obrázku (ale pravděpodobně „zobrazení podle kategorií“, protože toto zobrazení je standardně nastaveno), klikněte levým tlačítkem myši na nápis „Přepnout na klasické zobrazení ".

Poté rychle dvakrát klikněte levým tlačítkem myši na ikonu "Možnosti složky" - zobrazí se nastavení vlastností složky. Ve výchozím nastavení se dostanete na kartu „Obecné“. Klikněte levým tlačítkem na záložku "Zobrazit".

Zrušte zaškrtnutí políčka vedle „Skrýt přípony pro registrované typy souborů“ kliknutím levým tlačítkem myši. Pokud tento nápis nevidíte, použijte pravý posuvník (rolovací lištu) a „posouvejte“ na konec nabídky (přesuňte ukazatel myši nad posuvník, stiskněte levé tlačítko myši a držte tlačítko stisknuté, posuvník táhněte dolů ).

Jak vytvořím soubor? Například txt.

Začněme s jednoduchý příklad... Vytvořme si běžný textový dokument (soubor) na naší ploše. To provedeme následujícím způsobem.

Umístěte ukazatel myši (kurzor) do oblasti pracovní plochy, kde nejsou žádné zkratky. Klepněte pravým tlačítkem myši, klepněte levým tlačítkem na "Nový" - "Textový dokument".

Na ploše by se měl objevit zástupce s obrázkem „sešitu s volnými listy na pružinách, jak to bylo s textem“ pod názvem „Textový dokument.txt“.

Počítačově řečeno, vytvořili jsme textový soubor. Upozorňujeme, že kromě slov, kterým rozumíme, je v názvu souboru tečka a tři nesrozumitelná anglická (latinská) písmena. K čemu to všechno je a k čemu to je? Jdeme popořadě.

Textový dokument.txt Je to ve skutečnosti název samotného souboru, který se skládá z:

    1. název

V tomto případě je název souboru textový dokument (v zásadě může být název souboru jakýkoli, může se skládat z jednoho nebo několika slov, může obsahovat speciální znaky, například podtržítko, pomlčku nebo mezeru. V našem případě soubor jméno se skládá ze 2 slov a jednoho speciálního znaku (kupodivu) - mezery. tedy pokud je to pro nás srozumitelná kombinace slov Textový dokument, pak počítač bude toto jméno vnímat jako textový prostorový dokument (Toto je pro informaci , to nemá nic společného s naším tématem. Jen se můžete v budoucnu srazit, aby vás to nepřekvapilo).

    1. Oddělovač

Tečka (.) Je znak, který odděluje název souboru a příponu souboru. Proč přesně ta pointa? Historicky od konce staletí. Prostě se tak rozhodli už dávno, když se programy teprve rodily. Ano, obecně a pěkně - nic zbytečného a nebolí oči.

    1. Rozšíření

Samotné slovo rozšíření, jak se mi zdá, je srozumitelnější. Zde je název souboru, vzali ho a rozšířili o několik písmen a název souboru se rozšířil (no, nebo delší). V našem případě má rozšíření tvar txt... Toto je txt a říká operačnímu systému (Windows), který program má tento soubor otevřít, abychom mohli vidět (číst), co je v tomto souboru napsáno (v tomto případě textový soubor), nebo tam něco napsat. Také říkají, že tento soubor je v textovém formátu (více o formátech později).

Pokud je to zatím jasné, co je přípona souboru, pak dám dospělou formulaci: Přípona souboru označuje operačnímu systému jeho formát, v našem případě je soubor ve formátu txt.

Dlouho jsem přemýšlel, zda udělat exkurzi do historie v rámci tohoto tématu nebo ne, ale přesto jsem se rozhodl napsat, protože v tomto exkurzu najdete několik dalších odpovědí na otázky „proč ...“.

Kdysi, když počítače byly velké a slabé, nebyla tak krásná vícebarevná grafika, kterou nyní vidíte na monitoru svého počítače, a v Sovětském svazu bylo zvykem nazývat počítače počítače (elektronické počítače nebo PC, kde "P" znamenalo osobní), ale programátoři byli matematici. Na obrazovce monitoru byl tehdy vidět pouze bílý nebo zelený text na černém pozadí. Počítače byly tehdy 8bitové (teď si s tím hlavu nelámejte, berte to s důvěrou). Tehdy byl boj o každou informaci. Byly vyvinuty různé standardy.

V této době tedy padlo jedno z rozhodnutí, že název souboru bude mít název formuláře / oddělovač / příponu.

Opět, kvůli nedostatku zdrojů, bylo pod názvem souboru přiděleno 8 znaků (řekněme ne více než 8 znaků, to znamená, že méně je možné, ale více než 8 je nemožné), udělejte tečku jako oddělovač a pouze 3 pro rozšiřující znak (písmeno).

Čas vypršel. Pokrok se nezastavil. Počítače se staly malými a výkonnými s krásnou, krásnou barevnou grafikou, která lahodí našim očím. Bitová hloubka osobní počítače se zvýšil 8krát. A nyní máte před sebou 32bitový nebo 64bitový počítač s 32bitovým nebo 64bitovým operačním systémem (s největší pravděpodobností Windows).

Jak se počítače stávají výkonnějšími, omezení délky názvu souboru je méně důležité. Dnes je to někde až 256 znaků.

Takže to je vše. Vzhledem k tomu, že po celém světě existují miliardy názvů souborů a tyto názvy mohou být libovolné, pak těchto 256 znaků pro oči stačí. Zajímavější s rozšířeními. Ve skutečnosti není tolik formátů souborů (relativně samozřejmě) a stále je dost, obecně 3 znaky. Nyní jsou v příponě souboru 4 znaky (je jich více), ale jde spíše o návaznost. Například soubor vygenerovaný testem Word editor z balíčku Microsoft Office 2003 má příponu .doc a soubor vytvořený testovacím editorem Wordu z balíček Microsoft Office 2007 (novější verze tohoto balíčku) má příponu .docx.

Další zajímavý bod. Jakmile počítače dosáhly svého vývoje, kdy se na monitorech začala objevovat grafika a nejen text, pak se objevily zkratky (Ano, vlastně manipulátor myši. Myši sovětské výroby měly docela velká velikost, takže se jim pohrdavě říkalo krysy). Takže ty malé obrázky na štítcích (v našem případě je to obrázek "volného sešitu na pružinách, jak to bylo s textem") - to jsou také často samostatné soubory, v té době v podstatě měly tzv. přípona .ico zkratka na 3 znaky anglického slova ikona, která v anglický jazyk znamená ikonu, symbol, ikonický obrázek. Od té doby se těmto malým obrázkům říká ikony. Jiné názvy pro tyto malé obrázky jsou piktogramy, ikony.

A tak zpět k našim beranům, tedy k souboru „Text document.txt“ na naší ploše.

Klikneme 2x rychle levým tlačítkem myši na zástupce souboru "Text document.txt", který jsme vytvořili. H'm. (Ale zajímavé je, že na něj můžete rychle dvakrát kliknout, abyste otevřeli soubor? A v tuto chvíli nemůžete hýbat myší, protože pokud pohybujeme myší mezi jednotlivými kliknutími, právě toto otevření nebude fungovat. a nenaučili jste se, jak rychle kliknout levým tlačítkem myši 2x za sebou.Asi mám zkřivené ruce nejspíš nabroušené na perlík.Používám proto starou "starou" metodu, která šetří nervové buňky.) Otevírám však soubory jinak. Kliknu pravým tlačítkem na zástupce, vyberu z nabídky nejvyšší položku nabídky „Otevřít“ a kliknu na ni levým tlačítkem. (Myš používáme velmi často. Pokud nevíte jak nebo se vám s ní špatně pracuje, můžete si projít dvě lekce o a o)

co vidíme? Vidíme prázdný soubor otevřený programem "Poznámkový blok" (prázdný, protože jsme tam ještě nic nezapsali - nebude to trvat dlouho, budeme psát další).

Mimochodem, pojďme psát. Jako líný člověk ve svém životě prostě píšu na klávesnici. Navíc, když to jde a nedělat to. Jen to (text) odněkud zkopíruji. Aby byl text smysluplný a užitečný v životě, zkopíruji sem recept na mé oblíbené palačinky z internetu. Jsou tak tenké, že i prosvítají.

Nechte náš textový dokument zůstat na ploše. A přejdeme na internet na stránku bezplatného simulátoru klávesnice na stránce http://stamina.ru/blog/pitanie/blini a zkopírujeme si odtud část receptu následovně.

Přesuneme ukazatel myši na začátek textu, který chceme vybrat, nebo spíše trochu doleva, stiskneme levé tlačítko myši a při stisknutém tlačítku „přesuneme“ ukazatel myši na konec fragment textu, který potřebujeme. Pokud jsme s vybranou oblastí textu spokojeni, uvolníme levé tlačítko myši a ihned klikneme na pravé tlačítko myši (obrázek popisuje jinou verzi stejné akce). Objeví se nabídka, ve které najedeme ukazatelem myši na položku nabídky „Kopírovat“ a klikneme levým tlačítkem myši.

Vezměme si nějaký referenční disk. Váš počítač má například 10GB (gigabajtovou) jednotku „G:“. Nebo pokud je v bytech 10 000 000 000 bajtů (ve skutečnosti o něco více, ale pro nás to teď není důležité).

Je snadné spočítat, že se na tento disk vejdou takové soubory, jako je náš „Pancake recipe.txt“: 10 GB vydělíme našimi 507 bajty a dostaneme asi 19 723 866 souborů (ve skutečnosti o něco méně, ale to pro nás také není důležité teď)...

Zhruba řečeno, na náš 10GB disk se vejde 20 milionů souborů, jako je náš Recipe.txt na palačinky.

Tímto chci ukončit 1. část článku, ve které jsme na příkladu jednoduchého textového souboru začali uvažovat o významu pojmů jako „soubor“, „formát“, „přípona“. Tyto koncepty budeme zvažovat již u "těžších" formátů souborů, jako jsou obrazové soubory, hudební a video soubory, no a mnoho dalšího, co to doprovází.

To je vše. Hodně štěstí a kreativních úspěchů všem. 🙂

P.S. Přečtěte si také druhou část článku, o a třetí - o.

Po zavření souboru se spojení mezi proměnnou souboru a fyzickým souborem nepřeruší a soubor lze znovu otevřít bez dalšího volání procedury Přiřadit.

Zavřít postup se zavře otevřít soubor

zavřít(proměnná_souboru);

Uzavření souboru zajišťuje bezpečnost a úplnost fyzického souboru.

Pokud byl program před zavřením souboru přerušen kvůli chybě, bude na médiu stále vytvořen, ale obsah poslední vyrovnávací paměti se do souboru nepřenese.

Totéž se stane, pokud zapomenete ve svém programu vůbec zavolat Close.


Textový soubor je to sbírka řetězců znaků s proměnnou délkou.

Řetězce se skládají ze znaků ASCII pro MS-DOS a ANSI pro Windows.

Lze jej vytvářet a upravovat pomocí libovolného textového editoru kódu Delphi, Lazarus nebo Word, WorPad nebo NotePad.

(Při vytváření v Delphi vyberte v hlavní nabídce Soubor ÞNový ÞJiné, tím se otevře dialogové okno Nové položky. V záložce Nový vyberte ikonu Text a stiskněte klávesu OK

Při vytváření v Lazarus vyberte z hlavní nabídky Soubor Þ Nový, tím se otevře dialogové okno Nový.... V dialogovém okně vyberte ModuleÞText a stiskněte tlačítko OK).

Textové soubory mají příponu * .txt.

Schematické znázornění textového souboru:

Řídicí znaky # 13 a # 10 (carriage return - zadávání dalších znaků začne od první pozice a line feed - zadávání začíná od prázdného řádku.).

Symboly # 13 a # 10 - značka konce řádku.

Prázdný řetězec obsahuje pouze znaky # 13 a # 10.

Na konci souboru je znak konce souboru - řídicí znak # 26 ( značka konce souboru).

Prázdný textový soubor obsahuje jeden znak # 26.

Při zápisu čísel, řetězců a logických hodnot se převádějí do symbolické (textové) podoby.

Při čtení čísel a řetězců jsou automaticky převedeny z textové reprezentace na strojovou.

Chcete-li pracovat s textovým souborem, musíte definovat proměnnou souboru:

Pokud je soubor otevřen pro zápis (procedura přepsání) - je povolen pouze zápis dat.

Pokud je soubor otevřen pro čtení (procedura resetování) - je povoleno pouze pro čtení.

Čtení dat z textového souboru se provádí procedurami Read a Readln:

Číst

Readln(proměnná_souboru, seznam_vstupů);

input_list je seznam proměnných typu znak, řetězec, celé číslo a skutečné číslo.

Složité strukturované typy (jako jsou pole, množiny, záznamy atd.) lze zadávat pouze po prvcích (podle polí záznamů).

Po přečtení konkrétní komponenty se ukazatel souboru přesune na další komponentu.


Pokud čtete soubor do proměnné typu char, pak procedura Read přečte jeden znak. Když je dosaženo konce řádku, přečtou se znaky konce řádku # 13 a # 10, a když se dosáhne konce souboru, přečte se znak konce řádku # 26.

Při čtení hodnoty do proměnné typu integer nebo real Nejprve se vybere podřetězec a odstraní se všechny úvodní mezery, tabulátory (# 9) a značky na konci řádku.

Čtení se zastaví, když narazí na první mezeru, značku konce řádku nebo znak tabulátoru.

Čtený řetězec číselných znaků je převeden na číslo, které je přiřazeno příslušné proměnné.

Další operace čtení začíná mezerou (značka konce řádku, znak tabulátoru atd.).

Pokud vybraný podřetězec obsahuje jiné než číslicové znaky, dojde k I/O chybě.

Při čtení dat do proměnné typu string procedura Read přečte všechny znaky až po značku konce řádku.

Pokud počet znaků řádku v souboru větší množství specifikované v deklaraci řetězcové proměnné, pak se další znaky nepřečtou.

Pokud procedura Read přečetla určitý řádek celý, pak při svém dalším volání začne čtení od značky konce řádku, což znamená, že bude načten řádek nulové délky.

Procedura čtení neposouvá ukazatel souboru na další znakový řetězec, a proto ji nelze použít ke čtení posloupnosti řádků.

Rutina Readln čte všechny znaky v řetězci, včetně koncového znaku, aby poskytla nový řádek pro ukazatel souboru.

Procedura může být volána bez vstupního seznamu, což způsobí, že se ukazatel na soubor přesune na začátek dalšího řádku souboru bez přečtení předchozího řádku.

Při použití procedury Readln ke čtení čísel mějte na paměti, že po přečtení poslední číslice čísla budou všechny textové znaky, které zbývají před značkou konce řádku, přeskočeny a první znak dalšího řádku textu soubor bude k dispozici.


Zápis do textového souboru se provádí pomocí postupů Napsat a Writeln:

Napsat

Writeln(proměnná_souboru, seznam_výstupů);

Zde file_variable je proměnná typu text;

output_list je seznam proměnných nebo výrazů typu znak, řetězec, celé číslo, reálný nebo booleovský typ.

Rozdíl mezi Writeln a Writeln je ten, že řádek zapsaný do souboru pomocí Writeln je ukončen znakem konce řádku.

Pokud je procedura Writeln použita bez výstupního seznamu, zapíše se do souboru prázdný řádek.

Chcete-li přečíst všechna data z textového souboru, použijte funkci Eof, který určuje, zda bylo dosaženo konce souboru. Syntaxe pro volání této funkce.

Eof(proměnná_souboru);

Vrací booleovskou hodnotu. Pokud je ukazatel souboru za posledním prvkem souboru nebo pokud je soubor prázdný, funkce vrátí hodnotu True. V opačném případě vrátí False.

Formát TXT je nejběžnějším formátem pro ukládání a přenos textových dat. Soubor TXT může být formátovaný / neformátovaný blok textových informací implementovaný jako sekvence řádků.

Formátovací nástroje lze aplikovat na libovolný textový blok takových informací a nastavit: velikost a styl psaní fontu, velikost řádkování a také další stylové prvky v závislosti na potřebách uživatele.

V OS soubor Windows TXT se nazývá „ Textový dokument“. Pokud je soubor TXT v softwarovém balíčku, který se má nainstalovat, bude mít název „ Readme“ (V drtivé většině případů).

TXT je nejzákladnějším formátem pro reprezentaci textových dat, ale je základem pro specializovanější rozšíření, jako jsou a.

Textový dokument TXT může podporovat úpravy nejen na PC s různými OS (Windows, Mac, Linux), ale i na mobilní zařízení ah iPhone a iPad v systému Android. Také elektronické knihy Txt jsou podporovány na mobilních platformách.

Programy pro otevírání souborů TXT

Textový program pro většinu uživatelů Windows je tradiční „ Notebook"nebo standardní prostředky Microsoft Office (MS Word).

Je docela pozoruhodné, že práce s rozšířením TXT je implementována ve většině internetových prohlížečů ( internet Explorer , Opera atd). Další běžné aplikace (pro které si musíte nejprve stáhnout dokument Txt), které podporují vytváření / otevírání / úpravy souborů, jsou:

  • Staroffice (OS Windows);
  • Geany (OS Windows);
  • (OS Windows);
  • Apple textedit (Mac OS)
  • Calibre (Mac OS);
  • Plannamesa neooffice (Mac OS);
  • gedit (OS Linux);
  • Kwrite (OS Linux).

Pro zobrazení textových informací na Obrazovka iPhone, iPad nebo jiná mobilní zařízení, lze použít některý z prohlížečů Kingsoft office pro Android nebo Officeuite.

Jak převést TXT do jiných formátů

  • TXT -> ASCII (doporučený software - Microsoft Windows Poznámkový blok);
  • TXT -> ASC, TXT -> AWW (doporučený software - Ability write);
  • TXT -> CBR (doporučený software - Bezplatná online konverze souborů);
  • TXT -> DOC, TXT -> DOCX, TXT -> ODT, TXT -> PDF, TXT -> RTF (doporučený software -);
  • TXT -> EPUB, TXT -> SNB (doporučený software - Calibre);
  • TXT -> LWP (doporučený software - Ability write).

Tento software podporuje jeho práci na základě OS Windows.

Proč TXT a jaké jsou jeho výhody?

Můžeme to říct rozšíření TXT- jeden z nejvíce univerzální formáty ukládání a přenos textových informací. Soubory TXT jsou dokonale přizpůsobeny pro širokou škálu textových editorů, včetně interní aplikace OS.

Příslušnost ke konkrétní znakové sadě). Tyto znaky jsou obvykle seskupeny do řetězců (angl. řádky, řádky). PROTI moderní systémy ah řetězce jsou odděleny oddělovači řádků, v minulosti se používalo ukládání řetězců ve formě záznamů konstantní nebo proměnné délky (viz: Děrný štítek). Někdy konec textového souboru (zejména pokud je v souborový systém neukládá informace o velikosti souboru) je také označen jedním nebo více speciálními znaky známými jako značky konce souboru.

Textový soubor může obsahovat formátovaný i neformátovaný text.

Výhody a nevýhody

výhody:

  • Všestrannost - textový soubor lze číst (tak či onak) na jakémkoli systému nebo OS, zejména pokud jde o jednobajtová kódování jako ASCII, která nepodléhají problému běžnému u jiných formátů souborů - nezajímá je rozdíl v pořadí bajtů nebo slova délky stroje na různých platformách.
  • Stabilita – každé slovo a znak v takovém souboru je soběstačný a pokud dojde k poškození bajtů v takovém souboru, je obvykle snazší obnovit data a pokračovat ve zpracování zbytku obsahu, zatímco v komprimovaných nebo binárních souborech poškození několika bajtů může znemožnit obnovení celého souboru obsahu. Mnoho systémů správy verzí je navrženo pro textové soubory a může pracovat pouze s binárními soubory jako celkem.
  • Formát textového souboru je extrémně jednoduchý a lze jej změnit pomocí textového editoru – programu, který je součástí téměř každého OS.

Nevýhody:

  • Velké nekomprimované textové soubory mají nízkou informační entropii – tyto soubory zabírají více místa, než je nutné minimum. Tato redundance sice určuje zvýšenou odolnost vůči poruchám v kanálech přenosu dat a při příjmu dat z médií, například z magnetické pásky.
  • Některé operace s textovými soubory jsou neúčinné. Pokud se například v souboru objeví číslo, počítačový systém je bude muset před zahájením operací s ním převést do svého interního formátu pomocí poměrně složité procedury převodu čísel; abyste přešli na 1000. řádek, musíte před ním napočítat 999 řádků; je obtížné nahradit jeden řádek jiným atd. Proto se při práci s velkým množstvím dat používají textové soubory pouze jako meziformát, který zajišťuje interoperabilitu.

Formáty založené na textových souborech

Pro svou jednoduchost se textové soubory často používají k ukládání servisních informací (například protokolů). Textový formát slouží jako základ pro mnoho specializovanějších formátů (např. .ini, SGML, HTML, XML, TeX, zdrojové kódy programovacích jazyků).

V textovém souboru může být text uložen jak v neformátovaném, tak ve formátovaném nebo značkovacím tvaru (například Rich Text Format, HTML), kde lze formátování aplikovat na každý znak (font, styl, velikost atd.).

Přípony názvů souborů

Unicode v textových souborech

Použití Unicode v textových souborech sice řeší především „problém s kódováním“ a standardizuje použití řídicích znaků, ale vytváří své vlastní problémy. Ve většině moderních systémů je nedělitelnou jednotkou informace v datovém proudu bajt (8 bitů), kterých je potřeba několik pro zakódování jednoho znaku z Unicode. Jako řešení se používají nekompatibilní systémy UTF-8 a dvě verze UTF-16 (UTF-16LE a UTF-16BE s opačným pořadím bajtů). Někdy je na začátek souboru přidán speciální znak (U + FEFF), který umožňuje jednoznačně rozpoznat formát. UTF-8 má tu výhodu, že je zpětně kompatibilní s ASCII, ale programové zpracování textu v UTF-8 je komplikováno nekonzistentní velikostí znaků. Také texty Unicode jsou ještě redundantnější než 8bitové.

Řídící znaky

Různé operační systémy si udržují vlastní odřádkování a reprezentaci konce souboru. V systému UNIX se odřádkování skládá z jednoho znaku LF (kód 10), v systému Mac OS se skládá ze znaku CR (kód 13) a v systémech DOS a Windows je odřádkování zakódováno jako sekvence dvou znaků: CR a LF.

Kromě těch pojmenovaných používají textové soubory symboly, jako je tabulka (kód 9) a posun stránky (kód 12).

viz také

  • Text jako obrázek

Poznámky (upravit)


Nadace Wikimedia. 2010.

  • Biblická jména
  • Hnutí za práva sexuálních a genderových menšin

Podívejte se, co je "Textový soubor" v jiných slovnících:

    textový soubor- Soubor obsahující řádky písemných informací, které lze přímo vytisknout na displej nebo tiskárnu pomocí běžných příkazů operačního systému. Soubory vytvořené textovými procesory nejsou textové soubory, protože obsahovat ... ...

    Soubor (počítač)- Soubor (anglická složka souborů, pořadač) pojem ve výpočetní technice: entita, která vám umožňuje přístup k jakémukoli zdroji výpočetního systému a má řadu funkcí: pevný název (sekvence znaků, číslo nebo ... Wikipedia

    TEXTOVÝ PROCESOR- (textový editor), počítačový systém určený k vytváření a zpracování textu. Pokud lze systém použít pouze k tomuto účelu, pak se nazývá specializovaný textový procesor. Osobní ... ... Vědeckotechnický encyklopedický slovník

    ASCII soubor- Textový soubor obsahující pouze znaky s kódy do 127 (sedmibitová znaková sada ASCII). Takový soubor neobsahuje symboly národních abeced a pseudografické symboly. Témata informační technologieTechnická příručka překladatele

    definiční soubor- Speciální textový soubor obsahující direktivy používané k propojení objektových komponent programů (nebo knihoven) do spustitelného souboru. [E.S. Alekseev, A.A. Myachev. Anglický ruský vysvětlující slovník inženýrství počítačových systémů. Moskva 1993] ... ... Technická příručka překladatele

    inicializační soubor- Speciální textový soubor používaný při načítání prostředí a jednotlivých programů pro prvotní nastavení parametrů. [E.S. Alekseev, A.A. Myachev. Anglický ruský vysvětlující slovník inženýrství počítačových systémů. Moskva 1993] Témata informačních technologií v ... Technická příručka překladatele

    Soubor- Tento termín má další významy, viz Soubor (významy). Soubor (anglicky file) je blok informací na externím paměťovém zařízení počítače, který má určitou logickou reprezentaci (počínaje jednoduchou posloupností ... ... Wikipedia

    soubor- podstatné jméno, m., uptr. srov. často Morfologie: (ne) co? Soubor č? soubor, (viz) co? soubor než? soubor, co s tím? o souboru; pl. co? soubory, (ne) co? soubory než? soubory, (viz) co? soubory než? soubory, co s tím? o souborech 1. Pole se nazývá soubor ... ... Dmitrievův vysvětlující slovník

    konfigurační soubor- nebo konfigurační soubor slouží k uložení nastavení počítačové programy počítaje v to operační systémy... Konfigurační soubory jsou zpravidla v textovém formátu a uživatel programu je může číst a upravovat. ... ... Wikipedia

    soubor se slovy oddělenými pro dělení slov- Soubor obsahující textový dokument, ve kterém jsou slova rozdělována pomocí speciální funkce umístění. Témata informačních technologií obecně EN soubor dělení slov ... Technická příručka překladatele

knihy

  • Portfolio žáka prvního stupně. Program mimoškolních aktivit. Metodická příručka (+ CD), Umnova Marina Sergeevna, Given pracovní program určené k organizaci práce s portfoliem žáků 1. stupně v rámci mimoškolní aktivity... Program byl vyvinut a sestaven s ohledem na federální ... Kategorie: Vyučovací a výchovná práce ve škole Řada: Vedení třídy Vydavatel:

Textové soubory

Textové soubory jsou určeny k ukládání textových informací. Právě v takových souborech jsou uloženy například zdrojové kódy programů. Komponenty textových souborů mohou mít proměnnou délku, což výrazně ovlivňuje způsob práce s nimi. Ke každému řádku textového souboru Pascal lze přistupovat pouze postupně, počínaje prvním. Funkce přiřazení, resetování, přepsání, čtení, zápis a eof platí pro textové soubory. Při vytváření textového souboru je na konec každého záznamu (řádku) umístěn speciální znak EOLN (konec řádku). K určení, zda byl dosažen konec řádku, existuje logická funkce stejného jména EOLN (<имя_ф_переменной>), která se vyhodnotí jako true, pokud bylo dosaženo konce řádku.

Kromě procedur čtení a zápisu se při práci s textovými soubory používají jejich varianty readln a writeln. Rozdíl je v tom, že procedura writeln zapíše do souboru speciální značku konce řádku po zapsání zadaného seznamu. Tato funkce je vnímána jako přechod na novou řadu. Rutina readln po přečtení daného seznamu vyhledá v souboru terminátor dalšího řádku a připraví se na čtení od začátku dalšího řádku.

Příklad řešení problému se soubory

Předpokládejme, že potřebujeme vytvořit textový soubor a poté jej přepsat tohoto souboru ve druhém pouze ty řádky, které začínají písmenem „A“ nebo „a“.

Řešení: potřebujeme dvě proměnné souboru f1 a f2, protože oba soubory jsou textové soubory, typ proměnných bude text. Úloha je rozdělena do dvou fází: první je vytvoření prvního souboru; druhý je čtení prvního souboru a generování druhého, pak zobrazení obsahu druhého souboru na obrazovce.

Program primer;

Var f1, f2: text;

I, n: celé číslo;

S: řetězec;

Začít

(vytváříme první soubor)

Přiřadit (f1, 'soubor1.txt'); (vytváříme vazbu mezi proměnnou souboru a fyzickým souborem na disku)

Přepsat (f1); (otevřít soubor pro zápis)

Readln (n) (určete počet vstupních řádků)

pro i: = 1 až n do

začít

readln (s); (zadávejte řetězce z klávesnice)

writeln (f1, s); (do souboru zapisujeme postupně řádky)

konec;

zavřít (f1); (dokončíme práci s prvním souborem, nyní je na disku soubor s názvem file1.txt obsahující řádky, které jsme zadali. Tím je program dokončen, se souborem můžete pokračovat v jiném programu, jindy, ale budeme pokračovat)

(část druhá: čtení z prvního souboru a vytvoření druhého)

Reset (f1); (otevřete první soubor pro čtení)

Přiřadit (f2, 'soubor2.txt'); (navážeme spojení druhé proměnné souboru s fyzickým souborem)

Přepsat (f2); (otevřete druhý soubor pro zápis)

(Dále je potřeba postupně číst řádky z prvního souboru, zkontrolovat podmínku a zapsat požadované řádky do druhého souboru. Pro čtení z textového souboru se doporučuje použít smyčku podle podmínky "do konce soubor")

Zatímco ne eof (f1) udělejte

Začít

Readln (f1, s); (přečtěte si další řádek z prvního souboru)

Jestliže (s = 'A') nebo (s = 'a'), pak

Writeln (f2, s); (do druhého souboru zapíšeme řádky splňující podmínku)

Konec;

Zavřít (f1, f2); (dokončení práce se soubory)

(část třetí: zobrazení druhého souboru)

Writeln;

Writeln (‚Druhý soubor obsahuje řádky:‘);

Reset (f2); (otevřete druhý soubor pro čtení)

Zatímco ne eof (f2) udělejte (až do konce druhého souboru)

Začít

Readln (f2, s); (přečtěte si další řádek z druhého souboru)

Writeln (s); (zobrazit řetězec na obrazovce)

Konec;

Konec.

Cíl 1: Daný textový soubor. Spočítejte počet řádků v souboru.

  1. Otevřít soubor pro čtení;
  2. Uspořádejte čtení dat ze souboru řádek po řádku (readln (f, s), kde s je proměnná typu řetězec), počítejte hodnotu proměnné čítače k ​​v každém kroku čtení;
  3. Zobrazení hodnoty proměnné čítače;
  4. Zavřete soubor.

program z1;

var k: celé číslo;

s: řetězec;

f: text;

začít

přiřadit (f, "vstup.pas");

reset (f);

k: = 0;

zatímco ne eof (f) nezačíná

readln (f, s); k: = k + 1, konec;

writeln ("k =", k);

zavřít (f);

konec.

Úkol 2: Daný textový soubor. Vytiskněte všechny jeho řádky začínající znakem "T".

Pojďme sestavit algoritmus pro řešení problému (před zahájením řešení problému vytvořte textový datový soubor - input.pas):

  1. Propojit logický soubor f s fyzickým souborem input.pas;
  2. Otevřít soubor pro čtení;
  3. Uspořádejte čtení dat ze souboru řádek po řádku (readln (f, s), kde s je proměnná typu řetězec), přičemž v každém kroku zkontrolujte, zda řádek splňuje podmínku: první znak je "T", a pokud ano, zobrazit tento řádek na obrazovce;
  4. Zavřete soubor.

program z2;

var k: celé číslo;

s: řetězec;

f: text;

začít

přiřadit (f, "vstup.pas");

reset (f);

zatímco ne eof (f) nezačíná

readln (f, s);

if s = 'T' then writeln (s);

konec;

zavřít (F);

konec.

Cíl 3: Daný textový soubor. Vytiskněte všechny jeho řádky s více než 30 znaky.

Pojďme sestavit algoritmus pro řešení problému (před zahájením řešení problému vytvořte textový datový soubor - input.pas):

  1. Propojit logický soubor f s fyzickým souborem input.pas;
  2. Otevřít soubor pro čtení;
  3. Uspořádejte čtení dat ze souboru řádek po řádku (readln (f, s), kde s je proměnná typu řetězec), přičemž v každém kroku zkontrolujte, zda řádek splňuje podmínku: délka řádku je větší než 30, a pokud tak, zobrazte tento řádek na obrazovce;
  4. Zavřete soubor.

program z3;

var k: celé číslo;

s: řetězec;

f: text;

začít

přiřadit (f, "vstup.pas");

reset (f);

zatímco ne eof (f) nezačíná

readln (f, s);

if length (s)> = 30 then writeln (s);

konec;

zavřít (F);

konec.

Úkol 4: Daný textový soubor. Vytiskněte všechny jeho řádky obsahující zadaný text jako fragment.

Pojďme sestavit algoritmus pro řešení problému (před zahájením řešení problému vytvořte textový datový soubor - input.pas):

  1. Propojit logický soubor f s fyzickým souborem input.pas;
  2. Otevřít soubor pro čtení;
  3. Nastavit textový fragment na vyhledávání (s1);
  4. Uspořádejte čtení dat ze souboru řádek po řádku (readln (f, s), kde s je proměnná typu řetězec), přičemž v každém kroku zkontrolujte, zda řádek splňuje podmínku: obsahuje zadaný text (s1) jako fragment, a pokud ano, vypište tento řádek na obrazovku;
  5. Zavřete soubor.

program z4;

var k: celé číslo;

s1, s: řetězec;

f: text;

začít

writeln (‘vstoupitfragmenttext’);

readln (s1);

přiřadit (f, "vstup.pas");

reset (f);

zatímco ne eof (f) nezačíná

readln (f, s);

pokud pozice (s1, s)<>0 pak writeln (s);

konec;

zavřít (F);

konec.

Úkol 5: Daný textový soubor. Vytiskněte řádek 5 do nového textového souboru a zbytek na obrazovku.

Pojďme sestavit algoritmus pro řešení problému (před zahájením řešení problému vytvořte textový datový soubor - input.pas):

  1. Propojte logický soubor f s fyzickým souborem input.pas a logický soubor g s fyzickým souborem output.pas;
  2. Otevřít soubor pro čtení;
  3. Uspořádejte čtení dat ze souboru řádek po řádku (readln (f, s), kde s je proměnná typu řetězec), počítejte v každém kroku čtení hodnoty proměnné počítadla k a v každém kroku zkontrolujte, zda hodnota čítač je 5, a pokud ano, vypíše tento řádek do souboru g, jinak výstup na obrazovku;
  4. Zavřete soubor.

program z5;

var k: celé číslo;

s: řetězec;

f, g: text;

začít

přiřadit (f, "vstup.pas");

reset (f);

přiřadit (g, "výstup.pas");

přepsat (g);

k: = 0;

zatímco ne eof (f) nezačíná

readln (f, s): k: = k + 1;

jestliže k = 5, pak zápisln (g, s);

konec;

zavřít (f); zavřít (f);



Související články: