5 февруари 2016 г.

Файл. Типове файлове.

Файл в информационните технологии представлява организиран ресурс на информация, предназначен за ползване от компютърна програма. Файловете позволяват разглеждането на данните като една неделима структура и по този начин улесняват работата с тях — съхранение, четене, промяна, преместване, изтриване и др. Съхраняват се като последователност от байтове, върху определен носител на информация (твърд диск,компакт дискфлаш устройство), така че са достъпни за ползване и от други програми, а не само от тази, която ги е създала. Всеки файл съхранява точно определен вид информация (компютърна програма, текст, картинка, музика и т.н.). Текстовият файл например може да се разглежда като аналог на хартиен документ.
Програмите, които позволяват извършване на операции с файлове (създаване, преместване, изтриване, копиране и др.) се наричат файлови мениджъри.
-------
Файловата система представлява съвкупност от файлове и информация, която описва определени характеристики на всеки от тях. Целта на файловата система е да позволи подредба на файловете с цел по-лесно откриване. Има много файлови системи — те се различават по начина, по който се осъществява подредбата на файловете и по допълнителните характеристики, които се пазят за всеки файл. Тези характеристики могат да включват вид, права за достъп, размер, дата на последна промяна и др. Файловите системи обикновено подреждат файловете в структура, наречена Файлово дърво. Има различни файлове според функциите си във файловата система. Най-често се срещат:
  • Същински файл (regular file) - Съхранява информация, която директно се ползва от потребителя.
  • Директория (directory) - Съхранява списък с имена на файлове и препратки към самото съдържание на файловете.
  • Мека връзка (soft link) - Съхранява препратка към друг файл.

-------

Името на файла представлява последователност от символи. То се използва, за да се различават файловете един от друг и често предоставя някаква информация за съдържанието или предназначението на файла. Един файл може да бъде достъпен под 1 или повече имена. Всяко име на файла се нарича hard link. Някои компютърни програми третират файловете по различен начин в зависимост от имената им:
  • Символите след последната точка в името на файла се използват, за да покажат типа му. Понякога тези символи се наричат разширение на файла. Например:
При файла photo.jpeg символите след последната точка са jpeg. Те показват, че файлът е от тип image/jpeg. Това означава, че файлът е картинка във формат JPEG.
  • Точка (.) в началото на името на файла показва, че файлът е скрит. Такива файлове могат да не бъдат показвани при определени условия. Например:
Файлът .bashrc е скрит и не се показва, освен ако не е зададено показване на скрити файлове.
  • Тилда (~) в края на името на файла показва, че файлът е резервно копие на друг файл (обикновено той се именува по същия начин, но без тилда). Например:
Файлът status~ е резервно копие на файла status.

-------

Типът (форматът) на файла се определя от информацията, която се съхранява в него. Необходимо е типът да се знае, за да може файлът да се чете, променя. Обикновено програмите сами определят типа на даден файл, но понякога е необходимо потребителят да направи това. Има няколко техники за определяне на типа на файл. Обикновено програмите използват комбинация между няколко от тях:
  • По името на файла — в зависимост от символите след последната точка от името (разширение — виж файлов формат).
  • По съдържанието на файла — в зависимост от първите няколко байта от съдържанието на файла (магическо число).
  • По подаден MIME тип — понякога, когато файловете се пренасят през компютърна мрежа заедно със съдържанието се предава и т. нар. MIME тип (понякога наричан Internet media type) - кратък текст, който описва съдържанието на файла.
  • По код на типа — някои файлови системи съхраняват информация за типа на всеки файл (например HFS в операционната система MacOS).

-------

Съдържанието на файла се различава в зависимост от типа му — в най-простия случай то се състои само от същински данни. Някои файлове имат освен същински данни и т. нар. заглавна част (header) или крайна част (footer). Те служат за описание на определени характеристики на файла, специфични за типа му. Например за едно изображение заглавната част може да съдържа размер и брой цветове, а за звуков файл — изпълнител и име на песен. Файловете се разделят на две основни категории — текстови и двоични. Текстовите файлове се разглеждат като последователност от редове, като всеки ред се състои от символи. Те се използват за съхраняване на неформатиран текст. Двоичните (бинарните) файлове се разглеждат по определени правила в зависимост от типа си. Те могат да се използват за съхраняване много различни видове данни.

-------

Представляват последователност от редове. Всеки ред се състои от символи, значението на които се определя от специална таблица, наречена кодова таблица. Редът винаги трябва да завършва със знак за нов ред. Този знак може да бъде представен като един или няколко символа в зависимост отоперационната система. Един символ може да се състои от 1, 2, 3 или 4 байта.
Има различни кодови таблици. За да бъде прочетен един текстов файл правилно, за него трябва да бъде използвана правилната кодова таблица. Обикновено програмите откриват правилната кодова таблица автоматично, но понякога е необходимо потребителят да посочи необходимата таблица. Различните кодови таблици имат различни възможности. Най-проста таблица е ASCII. За да могат да се поддържат писмености, различни от латиницата и някои специални символи е създаден стандарта Unicode. Съществуват няколко негови реализации, като най-популярна е кодовата таблица UTF-8.
Текстовите файлове често се използват за конфигурационни файлове или текстови документи (например HTML документ). Понякога за обозначаване на текстов файл се ползва име, завършващо на .txt, .html, .xml, .c и др.

-------

Един такъв файл съхранява картинка. Според начина, по който е описана картинката изображенията могат да бъдат растерни и векторни. Растерните изображения се описват като таблица от точки, като всяка точка има определен цвят. Такива изображения могат да се променят лесно, но при промяната на размера им, качеството се влошава. Векторните изображения се описват като съвкупност от обекти — точки, отсечки, полигони и др. Такива изображения са по-трудни за промяна, но при промяна на размера им качеството не се променя. Някои изображения могат да съдържат анимирани картинки, прозрачни или частично прозрачни области и др. Най-често срещаните типове изображения са JPEGPNGGIF и SVG.

-------

Архивът представлява файл, който съхранява съвкупност от файлове и информация за всеки от тях. Този метод за съхранение се използва когато е необходимо множество файлове да се пренесат наведнъж. Някои архиви са компресирани, което значи, че е приложен специален механизъм, за да заема архивът по-малко пространство. Най-често срещаните типове архиви са tarzip и rar.



Няма коментари:

Публикуване на коментар