Самый часто используемый тип данных в компьютерном мире и интернете – текстовый. Видео и графика много красочнее и вообще лучше один раз увидеть, чем сто раз услышать. Ну и услышать тоже неплохо – на этот случай есть аудио-форматы данных. Однако правят компьютерный бал неказистые и скромные буквы и цифры. Без них никуда, даже названия другому файлу не дать. Текстовые данные важны и разнообразны – это и книги, и документы, и программный код. И для каждого назначения существуют собственные варианты форматов. Именно о них и пойдёт речь в этой статье. Правда следует сразу же сделать одну оговорку – в данном обзоре не будут затронуты форматы электронных книг, они заслуживают отдельного разговора. Здесь же говориться будет о форматах именно документов.

Текстовый формат – TXT (PlainText)

Итак – самое простое из возможных, формат TXT. Это текст в его, по сути, чистом и незамутнённом виде. Содержит только содержимое текста и абсолютный минимум служебных данных – символы начала и конца текста, перевода каретки и тому подобные.

Несмотря на практически спартанскую простоту, формат не лишён вариантов и различий. Во-первых, есть некоторые различия между Windows , Unix и MacOS версиями в которых используются разные символы конца строки. Также различия могут быть обусловлены использованием 8-битной (ASCII) либо 16-битной (UNICODE) кодовых страниц.

Однако, несмотря на это, формат TXT отличается крайней универсальностью, за что весьма любим программистами и системными администраторами.

Форматы документов MS Office и аналоги– DOC, DOCX, RTF, ODT

При всей универсальности и простоте TXT абсолютно непригоден для создания собственно документов – текстов предназначенных для печати с соблюдением определённых правил и норм оформления. Поскольку подобные документы кроме самого текста должны содержать ещё массу информации об оформлении и форматировании текста. А также о формате и размере листа бумаги, где они должны размещаться.

Для этих целей были созданы довольно многочисленные форматы различных офисных пакетов. Наиболее популярным и фактически близким к универсальному можно считать форматы MS Word – doc и docx. Первый представляет собой специальный закрытый формат, созданный компанией Microsoft для своего текстового редактора (точнее целую линейку форматов – за время своего существования он несколько раз подвергался усовершенствованию). Наряду с ним ещё на заре развития компании в сотрудничестве с корпорацией Adobe был создан формат RTF (Rich Text Format). В отличие от DOC структура этого формата доступна и он успешно поддерживается практически всеми существующими текстовыми редакторами. Хотя и несколько уступает DOC по набору доступных функций.

Закрытость разработок компании Microsoft привела к созданию открытого офисного пакета Open Office. Для которого был разработан собственный формат ODT (OpenDocument Text Format). Формат не очень хорошо поддерживается коммерческими редакторами, в том числе MS Word и может открываться ими с ошибками.

Наконец в 2007 году Microsoft решила отказаться от ставки на формат DOC и разработала семейство форматов Office Open XML в которое входит DOCX ставший основным форматов новых версий MS Word.

Формат PDF

Отказавшись от сотрудничества с Microsoft, компания Adobe двинулась своим путём. Ею был разработан формат PDF представлявший собой формат не столько для разработки документов, сколько для их просмотра и печати. В отличие от предыдущей группы, представляющих собой форматированный текст, вид которого тем не менее может изменяться в зависимости от того на какой конкретной машине он отображается или печатается, PDF представляет собой формат документа принципиально неизменного и сохраняющего внешний вид и вёрстку в любых условиях. Также он поддерживает довольно широкий спектр как полиграфических элементов, так и дополнительного сервиса (например защита документа паролем от редактирования либо печати и так далее). Всё это делает PDF скорее форматом для распространения сложных и профессионально выполненных документов и даже книг.


Зачем вам текст?

Сегодня существует три самых распространенных текстовых формата – TXT, RTF и DOC. В чем их различие и что их объединяет? Общее у них одно: все они сохраняют текстовую информацию. Различие заключается в том, какие возможности форматирования и обработки текста они предоставляют, а также – насколько доступна хранящаяся в них информация в отношении совместимости программ.

Самый простой текстовый формат

Самый старый и скромный по возможностям формат. Все, что можно делать с текстом в этом формате – это производить собствено ввод текста и сохранять разбиение на абзацы. Эта простота в определенных ситуациях приобретает значимость универсальности и прозрачности: TXT легко доступен для чтения в разных приложениях и на разных платформах. Кроме того, многие программы, даже не имеющие своей непосредственной задачей работу с текстом, умеют сохранять текст в формате TXT.

TXT-процессоры

С DOS-овских времен многие помнят текстовый процессор Lexicon, который умел обрабатывать TXT-формат на довольно высоком уровне. Сегодня основным инструментом для работы с TXT является стандартный Блокнот Windows. Тот, кому его функций кажется недостаточно, всегда может найти себе редактор по вкусу и потребностям во всемирной паутине, в том числе бесплатно. Например, используя freeware-программу Vega Константина Шереметьева, вы вряд ли увидите сообщение о том, что открываемый текстовый файл слишком велик; по заверениям автора, Vega версии 2.04 открывает файлы объемом до 2 Gb (!), а сама программа занимает при этом всего 9,5 kb (сравните, Блокнот в Windows XP «весит» около 65 kb); при этом Vega даже удобнее Блокнота и не требует установки. А вот другой образец возможностей обработки «простого текста». Текст, который вы читаете, был набран в процессоре UltraEdit от IDM Computer Solutions. Его сильная сторона – специальное отображение и обработка синтаксиса языков программирования, но и с самым незамысловатым текстом он может творить чудеса. Ценителям же удобных русифицированных программ, эргономичных и, главное, «знающих толк» в специфике кириллических кодировок, стоит познакомиться с программой Патриот.

Форматирование и универсальность

Rich Text Format – так расшифровывается аббревиатура, стоящая в названии формата, созданного корпорацией Microsoft. RTF представляет собой текст, размеченный с помощью специальных «управляющих слов», что позволяет производить и сохранять достаточно сложное форматирование, вставлять сноски, колонтитулы, рисунки, таблицы и формулы, хотя в обработке этих дополнительных объектов RTF уступает формату DOC. Уступает он DOC и в объеме файлов: использование для форматирования текста «управляющих слов» вместо стилевой таблицы не приводит к компактности. Однако, RTF выигрывает спор с DOC в отношении безопасности, т.к. его внутренняя организация не предусматривает хранения макрокода и, следовательно, неуязвима к макровирусам.

RTF-процессоры

RTF используется в качестве основного или поддерживаемого формата в многих, если не в большинстве программ обработки текста. Хорошим инструментом может послужить, например, Hieroglyph Михаила Морозова. В этой программе реализована не только проверка правописания русского языка, но и функция автоматической смены языковой раскладки клавиатуры. Текстовый процессор Atlantis от Rising Sun Solutions, существующий как в коммерческой, так и в бесплатной версиях, наверняка устроит многих пользователей продуманностью интерфейса, наличием большого количества быстрых клавиш, сменной инструментальной панелью и др. функциями. С RTF умеет работать и уже упоминавшийся редактор Patriot.

Самый «большой» текстовый формат

В формат DOC включены самые широкие возможности обработки и форматирования текста, включая создание сносок и комментариев, а также возможности создания, размещения и редактирования таблиц, диаграмм, изображений и других элементов. Правда, в полном объеме и наиболее корректно все эти возможности реализованы только в MS Word, чему способствует позиция Microsoft, не раскрывающей текущих спецификаций популярного формата. Несмотря на то, что DOC «понимают» и другие программы, их производителям не всегда удается обеспечить его корректное распознавание. В отличие от TXT и RTF, DOC является бинарным форматом, что делает его нечитабельным в простых тектовых редакторах и, более того, не обеспечивает полной совместимости его собственных версий.

DOC-процессоры

Основным и, ввиду упомянутых причин, «незаменимым» текстовым процессором для работы с DOC является MS Word, который наиболее полно реализует все возможности этого формата. Немало продуктивности и функциональности Ворду добавляют сторонние разработки – всевозможные дополнения, макросы и программы существуют в больших количествах на просторах сети. Конкуренцию Ворду обеспечивают, например, WordPerfect компании Corel, StarOffice от Sun Microsystems и бесплатный OpenOffice.org. Работая и в Word, и в других программах, следует помнить о проблеме совместимости форматов и сохранять документ в DOC только если вы уверены, что несовместимости не возникнет.

Применимость форматов

Безосновательно утверждать, что один из рассмотренных форматов хуже других, не учитывая особенностей задач, для решения которых следует их использовать. Поскольку мы не будем ставить перед собой задачу верстки в текстовом процессоре, то выбор практически однозначен. Для подготовки объемов текста от средних до очень больших и обеспечения «полного понимания» набранного любой программой верстки наиболее удобным представляется использование самого простого, компактного и универсального средства набора и хранения текста – формата TXT. Что же касается использования в верстке других текстовых форматов, то очень многое зависит от реализации их поддержки в конкретной программе макетирования.
OpenOffice.org – международный проект с открытыми исходными кодами, направленный на создание универсального офисного пакета, работающего на разных операционных платформах, имеющего открытый API и формат файлов, основанный на XML. По сути, OpenOffice.org это набор программ, разработанный в рамках данного проекта. В него входят: текстовый процессор, электронные таблицы, графический редактор, система презентаций и система доступа к данным. По своим возможностям он сопоставим с аналогичными коммерческими программами и вполне может рассматриваться, как альтернатива им. В настоящее время OpenOffice.org выпускается под двойным лицензированием: GPL и SISSL. Несмотря на отличия в этих лицензиях, для конечного пользователя OpenOffice.org является свободным.

OpenOffice.org ведет свое происхождение от офисного пакета StarOffice, разработанного немецкой фирмой StarDivision в середине 90-х годов. Осенью 1999 года корпорация Sun купила StarDivision. В июне 2000 года, уже под торговой маркой Sun вышел StarOffice 5.2 под MS Windows, Linux и Solaris. 13 октября 2000 года были открыты исходные тексты StarOffice (за исключение кода некоторых модулей, разработанных третьими фирмами), и этот день официально считается днем рождения OpenOffice.org. Сегодня над кодом OpenOffice.org работают как добровольцы со всего света, так и программисты корпорации Sun.

В настоящее время из одного исходного кода, разрабатываемого сообществом OpenOffice.org выпускаются два продукта: StarOffice, в который добавляются компоненты под проприетарной лицензией и свободный OpenOffice.org. В OpenOffice.org большинство проприетарных компонентов, присутствующих в StarOffice, заменено их свободными аналогами.

(По информации cnews.ru.)

Набор правил, по которым сохраняются данные в файле, называется форматом файла. Различные типы файлов, такие как текстовые файлы, растровая графика и т.п., используют различные форматы. В общем случае для одного типа файлов может быть определено несколько разных форматов, хотя часто под типом файла и форматом понимают одно и то же. Формат файла определяется по расширению имени файла, которое добавляется к имени файла при его сохранении в определенном формате, например, DOC, GIF и т. д.

Как правило, форматы файлов создаются для использования в строго определенной прикладной программе. Например, графические объекты, создаваемые в известном пакете векторной графики CorelDRAW, сохраняются как файлы с расширением CDR, а изображения, формируемые другим графическим пакетом, CorelXara, записываются на диск как файлы с расширением XAR. Некоторые форматы не связываются с конкретными приложениями, то есть являются универсальными. Одним из наиболее известных универсальных форматов является формат TXT (формат текстовых файлов DOS).

Часто используют сжатие компьютерных файлов для экономии места на носителе. Существует много способов сжатия файлов. Эти способы зависят от исходного формата файлов. Как правило, чем выше степень сжатия, тем медленнее выполняются операции чтения и записи.

Что касается алгоритмов сжатия, то имеются как алгоритмы сжатия без потери данных, так и алгоритмы, при использовании которых потеря данных возможна.



Сжатие без потерь гарантирует, что все данные, которые были в файле до сжатия, будут присутствовать и после распаковки файла. Механизмы сжатия без потерь используются при сохранении текста или числовых данных, например электронных таблиц или файлов документов. Примерами алгоритмов сжатия без потерь могут служить общеизвестные алгоритмы ZIP, ARJ, и другие.

Дадим краткое описание основных используемых форматов:

§ American Standard Code for Information Interchange ASCII (TXT). Формат текстовых файлов, разработанный Американским институтом стандартов (American National Standards Institute). Поддерживается всеми операционными системами и всеми программами. Представляет собой текстовый файл в DOS-кодировке, нет функции вставить рисунок, нет форматирования, работает во всех машинах, возможно создать только файлы малого объема.

§ ANSI (TXT). Формат текстовых файлов в кодировке ANSI (для кодовой страницы Microsoft Windows)

§ MsWord для DOS, Windows (.DOС). Формат документов, разработанный корпорацией Microsoft, поддерживается программами для MS-DOS и большинством текстовых процессоров. Он сохраняет исходное форматирование документов, а также стили начертания символов. Кроме текстовой информации, файлы этого формата могут содержать графические картинки с различными параметрами. Поддерживает 256 цветов. Не поддерживает сжатие. Используется в основном для обмена форматированными текстовыми данными между различными платформами и приложениями.

§ Hypertext Markup Language HTML (HTM, HTML). Язык разметки гипертекстовых документов. Все страницы, расположенные в Internet, созданы с использованием этого специального языка. HTML-документы представляют собой ASCII-файлы, доступные для просмотра и редактирования в любом текстовом редакторе. Отличием от обычного текстового файла является то, что в HTML-документах присутствуют специальные команды-теги, которые определяют правило форматирования документа. Если вам удалось освоить язык HTML, то вы можете создать страницы для Internet. Добавляя теги (метки) к обычному тексту, вы заставляете программу просмотра отображать этот текст определенным образом и размещать на странице изображения. Если вы изучили Java и JavaScript, то знаете, как расширить возможности HTML, помещая внутри тегов команды, написанные на языке сценариев.

§ Portable Document Format PDF (.PDF). Этот формат хранения документов, разработанный фирмой Adobe, претендует на роль открытого типографского стандарта для Web. Он рассматривается как альтернатива HTML. Недостатком HTML является то, что документы, переведенные в HTML, обычно не сохраняют первоначальный формат, причем HTML предлагает при просмотре очень ограниченное число гарнитур. Напротив, пользователи программы Acrobat и PDF-инструментария для создания, распространения и просмотра документов в первоначальном формате, знают, что читатели увидят публикацию именно такой, какой она была сделана. Формат PDF незаменим, если требуется получить точную копию необходимого документа. Как пример успешного применения PDF для документов на русском языке приведем сервер "Московских новостей" в Internet. Представленные на нем в электронном виде материалы полностью повторяют бумажный оригинал, отпечатанный типографским способом.

§ Standard Generalized Markup Language (SGML). Развитие HTML переводится как стандартный язык обобщенной разметки. Представляет собой инструментальный набор механизмов создания структурированных документов, размеченных с помощью дескрипторов (tags). По сравнению с HTML он обеспечивает более гибкие и разносторонние возможности форматирования в Web. Однако SGML отличается и повышенной скоростью, поэтому как более простое средство применяется PDF. Могущество SGML заключается в его межплатформенном структурном подходе к описанию содержания документов. SGML является фактически метаязыком, т.е. предназначен для описания языков разметки, применяемых при создании документов.

С текстовыми файлами (документами) мы сталкиваемся чуть ли не ежедневно. Однако в данном вопросе не следует путать расширение текстового файла и текстовый формат данных, это разные вещи. Попробуем определиться, что собой представляют файлы такого типа, и какими они бывают.

Расширение текстового файла: что это такое?

Начнем с того, что, как правило, большинство файлов такого типа имеют расширение в виде трех литер после разделителя (точки). Самый простой и наиболее часто встречающийся тип - это файлы с расширением.txt, открываемые в тех же системах Windows при помощи стандартного «Блокнота».

Однако, несмотря на общепринятые правила, расширения файлов текстовых документов могут содержать не три литеры, а больше (их число может достигать двенадцати, но не больше), например, файлы электронных книг.djvu. Кроме того, в расширении могут присутствовать цифры.

Что дает нам рассмотрение классификации текстового файла (документа) в плане их идентификации? А то, что один взгляд позволяет моментально решить важный вопрос: какое расширение имеют текстовые файлы, такова и программа, сопоставленная им для открытия или редактирования. Тут же во многих случаях почти всегда можно определить изначальное приложение, в котором такой файл был создан.


Однако не стоит забывать, что сегодня можно встретить достаточно большое число файлов с одинаковыми расширениями, но созданные в других приложениях или сопоставленные разным программам. Казалось бы, обычный файл с расширением.doc (.docx) изначально соответствует текстовому редактору Microsoft Word. Но ведь открыть его или сохранить в таком виде можно и в другом даже на «яблочных» компьютерах. Сюда же можно отнести и, так сказать, смешанный тип - файлы формата.pdf, содержащие уже не только текст, но и графику. Но ведь и документы Word могут содержать вставленные изображения.

Именно это и служит показателем того, что расширение текстового файла свидетельствует об универсальности самого формата, который является наиболее «читабельным» независимо даже от применяемой операционной системы. То же самое касается и любого типа.

Типы расширения файлов: текстовые

Вообще, на сегодня известно такое огромное число текстовых форматов и их расширений, что, наверное, практически ни один специалист не возьмется посчитать их полное количество.


Да, конечно, универсальность таких документов не вызывает сомнений, особенно если в них используется простейшая Но иногда проблема может заключаться в том, что не всякая кодировка поддерживается определенной системой или программой. Именно поэтому на экране вместо привычных букв появляется набор символов.

Что же касается разновидностей текстовых файлов, их все и не перечислишь. Наиболее распространенными являются следующие: .txt, .doc, .tex, .text, .pdf, .log, .apt, .ttf, .err, .sub, .djvu, .odt, .rtf и многие другие. Этот список можно продолжать до бесконечности.

Что самое интересное, многим файлам такого типа в системе отводится разная роль. К примеру, кроме обычного файла субтитров.sub, за их просмотр при открытии видео может отвечать обычный текстовый документ.txt, и в этом отношении многие форматы взаимозаменяемы.


Заметьте, даже исполняемые файлы могут иметь текст в качестве содержимого. Простейший пример - файл.bat, создаваемый в обычном «Блокноте» и содержащий текст в виде набора команд. При запуске происходит выполнение команд, а для редактирования используется меню «Открыть с помощью…», если изначально этому процессу не сопоставлено другое действие.


Подобная ситуация наблюдается и с документами, использующими разметку или языки программирования, скажем, файлы.html, .htm, .xml и т.д. Даже веб-страницы можно во многих редакторах открыть изначально как текстовые файлы, содержащие сторонние элементы.

Изменение расширений текстовых файлов

Что касается изменения расширения, иногда его можно поменять, например, .txt в.doc и обратно. Редактор Word откроет любой тип. То же самое относится к паре.txt - .bat при открытии в «Блокноте». Но в других случаях лучше такие манипуляции не производить, это попросту ни к чему не приведет, и другое приложение переименованный файл открыть не сможет. Изменение формата придется производить при помощи специальных программ-конверторов.

Вместо послесловия

Как уже понятно, расширение текстового файла может иметь множество вариаций, в зависимости от того, в какой именно программе был создан документ. Зато, равно как и в других случаях, по самому расширению практически всегда можно определить изначально ему сопоставленное приложение, в крайнем случае открыть любой другой программой, поддерживающей работу с таким типом данных, даже если оригинальное приложение на компьютере отсутствует. И как уже, наверное, понятно, именно текстовые файлы, по сути, являются в компьютерном мире самыми распространенными и универсальными, независимо от используемых программных пакетов и операционных систем.

Каждый пользователь ПК постоянно сталкивается с различными форматами текстовых файлов, но вряд ли задумывается о том, насколько богата история этих форматов и программ, подаривших человеку возможность читать книги, работать с текстом и создавать всю необходимую документацию прямо на компьютере.

История текстовых файлов не намного моложе самих персональных компьютеров - уже их шедевры были написаны в первых аналогах современного «блокнота». Так какие же бывают форматы текстовых файлов и программы для работы с ними? Для начала нужно понять, для чего нужны текстовые файлы, какие между ними различия и что у них общего. Объединяет абсолютно все текстовые форматы их основная задача - сохранение текстовой информации. Различаются они возможностями обработки и а также доступом к хранящейся в файлах информации в плане совместимости с другими программами.

Самым простым текстовым форматом традиционно является формат TXT. Он же самый скромный по возможностям и самый старый текстовый формат. Благодаря своей простоте (возможности TXT ограничиваются набором текста и разбивкой его на абзацы), именно этот формат зачастую используется огромным количеством приложений и программ на самых разных платформах.

С распространением персональных компьютеров и увеличением их продаж компания Microsoft создает еще один популярный формат, получивший название Rich Text Format (или просто RTF). Он представляет собой текст, который размечен с помощью определенных «управляющих слов», позволяющих не только производить, но и сохранять сложные элементы форматирования и вставлять в текст формулы, таблицы, рисунки, колонтитулы и сноски.

Однако RTF довольно сильно уступает в возможностях формату DOC, также созданному компанией Microsoft специально для пакета программ под названием Microsoft Office. Созданный более пятнадцати лет назад DOC включает в себя огромное количество возможностей для форматирования и обработки текста, создания, редактирования и размещения изображений, диаграмм, таблиц и других элементов. Следует заметить, что наиболее корректно эти функции будут работать только в программе MS Word. Это связано в первую очередь с тем, что Microsoft не текущих спецификаций формата DOC и не дает своим конкурентам и независимым разработчикам использовать возможности этого формата в полной мере. Именно этот факт и является одной из основных причин того, что кроме формата DOC в наше время широко используются и другие форматы текстовых файлов.

Главным отличием формата DOC от текстовых и TXT служит его бинарность, из-за которой он становится нечитабельным в таких простейших как Wordpad, Lexicon, Atlantis. Более того, в некоторых случаях можно наблюдать и несовместимость DOC-файлов, созданных в различных версиях программы MS Word.

Форматы текстовых файлов открывать и редактировать можно в огромном количестве программ. Кроме ранее упомянутого MS Word, самыми распространенными из них являются StarOffice, выпускаемый компанией Sun Microsystems, WordPerfect от Corel и бесплатный пакет OpenOffice.org.

С распространением электронных устройств-читалок популярность набирают и другие форматы текстовых файлов, к примеру, FB2 и LRF.

Для того чтобы получить возможность использования различных текстовых форматов на разных платформах, создано большое количество программ, называемых конверторами. Конверторы текстовых файлов позволяют сохранять исходный текст из одного формата в другой и использовать его в дальнейшем на различных устройствах и платформах.

Конверторы применяются не только для сохранения текста из одного в другой формат, но и для создания файлов, которые, в отличие от их исходников, можно использовать на устройствах, которые не способны «прочитать» оригинальные файлы. К примеру, некоторые электронные книги, которые не поддерживают популярные форматы текстовых файлов, способны запросто распознавать форматы LRF или FB2, полученные из исходных файлов с помощью программ-конверторов.



Эта статья также доступна на следующих языках: Тайский

  • Next

    Огромное Вам СПАСИБО за очень полезную информацию в статье. Очень понятно все изложено. Чувствуется, что проделана большая работа по анализу работы магазина eBay

    • Спасибо вам и другим постоянным читателям моего блога. Без вас у меня не было бы достаточной мотивации, чтобы посвящать много времени ведению этого сайта. У меня мозги так устроены: люблю копнуть вглубь, систематизировать разрозненные данные, пробовать то, что раньше до меня никто не делал, либо не смотрел под таким углом зрения. Жаль, что только нашим соотечественникам из-за кризиса в России отнюдь не до шоппинга на eBay. Покупают на Алиэкспрессе из Китая, так как там в разы дешевле товары (часто в ущерб качеству). Но онлайн-аукционы eBay, Amazon, ETSY легко дадут китайцам фору по ассортименту брендовых вещей, винтажных вещей, ручной работы и разных этнических товаров.

      • Next

        В ваших статьях ценно именно ваше личное отношение и анализ темы. Вы этот блог не бросайте, я сюда часто заглядываю. Нас таких много должно быть. Мне на эл. почту пришло недавно предложение о том, что научат торговать на Амазоне и eBay. И я вспомнила про ваши подробные статьи об этих торг. площ. Перечитала все заново и сделала вывод, что курсы- это лохотрон. Сама на eBay еще ничего не покупала. Я не из России , а из Казахстана (г. Алматы). Но нам тоже лишних трат пока не надо. Желаю вам удачи и берегите себя в азиатских краях.

  • Еще приятно, что попытки eBay по руссификации интерфейса для пользователей из России и стран СНГ, начали приносить плоды. Ведь подавляющая часть граждан стран бывшего СССР не сильна познаниями иностранных языков. Английский язык знают не более 5% населения. Среди молодежи — побольше. Поэтому хотя бы интерфейс на русском языке — это большая помощь для онлайн-шоппинга на этой торговой площадке. Ебей не пошел по пути китайского собрата Алиэкспресс, где совершается машинный (очень корявый и непонятный, местами вызывающий смех) перевод описания товаров. Надеюсь, что на более продвинутом этапе развития искусственного интеллекта станет реальностью качественный машинный перевод с любого языка на любой за считанные доли секунды. Пока имеем вот что (профиль одного из продавцов на ебей с русским интерфейсом, но англоязычным описанием):
    https://uploads.disquscdn.com/images/7a52c9a89108b922159a4fad35de0ab0bee0c8804b9731f56d8a1dc659655d60.png