Может файл книги в FB2 быть меньше ТХТ?

 
BY V.Stepan #01.12.2016 19:18  @Balancer#01.12.2016 19:09
+
-
edit
 

V.Stepan

аксакал
★★☆
Balancer> Какие-то проблемы были лет 10-15 назад, но это было очень давно

То, что стало заметно медленнее работать, это и сейчас есть. В общем, конкретно у нас UTF-8 никаких выгод не даёт.

Balancer> Только уже работающее старое решение не даёт тебе права наезжать на новые.

Под "старым решением" я подразумеваю библиотеки поддержки однобайтных строк, коим во всех языках программирования 100 лет в обед. А то как-то странно наши облачные решения в "старые" записывать :) . Нам на UTF-8 перейти особого гемора нет, решается достаточно быстро и просто. Но вот потестили, увидели, что выгод никаких, и отказались от перехода.
"Класс – это исключение случайностей"  
RU Balancer #01.12.2016 19:21  @V.Stepan#01.12.2016 19:18
+
-
edit
 

Balancer

администратор
★★★★★
V.Stepan> Под "старым решением" я подразумеваю библиотеки поддержки однобайтных строк, коим во всех языках программирования 100 лет в обед.

Если ты не обновлял строковые библиотеки 10+ лет, то там с большой вероятностью уже масса неисправленных уязвимостей. А если библиотеки обновлял, то сегодня они в массе своей не только прекрасно работают с utf-8, но из многих уже вообще выкинули зоопарк хаоса множественных кодировок, оставив один только utf-8.

V.Stepan> Но вот потестили, увидели, что выгод никаких, и отказались от перехода.

Это ваша узкоспецифичная заморочка. Столь же нелепая, как желание упомянутого тобой товарища всё переводит на Питон :)

Ну да я не настаиваю, это твои тараканы. Только почему-то не я к тебе на их счёт полез, а ты ко мне :)
 44
BY V.Stepan #01.12.2016 19:30  @Balancer#01.12.2016 19:21
+
+2
-
edit
 

V.Stepan

аксакал
★★☆
Balancer> А если библиотеки обновлял, то сегодня они в массе своей не только прекрасно работают с utf-8

Я где-то жаловался на качество поддержки utf-8, мол, глючит? Меня не устраивает скорость.

Balancer> но из многих уже вообще выкинули зоопарк хаоса множественных кодировок, оставив один только utf-8.

У нас до сих пор есть поддержка KOI-8R, что вполне радует.

Balancer> Только почему-то не я к тебе на их счёт полез, а ты ко мне :)

Потому что ты сказал, что безоговорочно всегда и везде UTF-8 рулез форева. А я несогласный из своего опыта.
"Класс – это исключение случайностей"  
RU Balancer #01.12.2016 19:35  @V.Stepan#01.12.2016 19:30
+
-
edit
 

Balancer

администратор
★★★★★
V.Stepan> Потому что ты сказал, что безоговорочно всегда и везде UTF-8 рулез форева.

Следим за руками:

>>>> Возможна ситуация, когда .txt в кодировке utf-8

>>> А бывает такое? И если бывает, то нафуа?

>> А зачем иначе? utf-8 сегодня стандарт де факто для любого обмена информацией

> Да ну его в пень ! Медленнее обрабатывается, и если не нужна многоязыковость, то я не понимаю, нафига он вообще нужен.

Как видишь, я поначалу нигде не давал никаких оценочных суждений. Это тебя сразу понесло...
 44
BY V.Stepan #01.12.2016 19:37  @Balancer#01.12.2016 19:35
+
+2
-
edit
 

V.Stepan

аксакал
★★☆
Balancer> Следим за руками:
>>> А зачем иначе? utf-8 сегодня стандарт де факто для любого обмена информацией

Вот я и слежу. У тебя нет вопросов, что может быть иначе.

P.S. Я предлагаю закруглиться. Ты, надеюсь, мои претензии к UTF-8 понял — избыточность, которая не всегда нужна, меньшая скорость и больший объём. Я же не отрицаю UTF-8 совсем, о чём и писал выше. Но для текстов только на русском он явный перебор.
"Класс – это исключение случайностей"  
LT Bredonosec #01.12.2016 19:54  @V.Stepan#01.12.2016 07:48
+
-
edit
 
V.Stepan> 1) У Виталия
блин, опять мимо )))
сорри )))

V.Stepan> 2) Оборудование тут совсем не при чём. Разговор о программных решениях.
ну или так ©
 26.026.0
RU Balancer #01.12.2016 20:00  @V.Stepan#01.12.2016 19:37
+
-
edit
 

Balancer

администратор
★★★★★
V.Stepan> Но для текстов только на русском он явный перебор.

Этот момент я озвучивал. Тексты только на русском (в рамках категории данных в целом) — это сразу порождение проблем. Начиная с французского в произведениях Толстого (на которых, вон, Варбан кодировку форума ломал, см. ссылки выше), кончая банальной русской типографикой в любимом тобой КОИ-8 (где даже символа номера № нет).

А последствия неюникодности mp3 до сих пор не расхлебали в Интернете... До сих пор массово гуляют mp3 с cp1251 в тегах, которые порождают постоянные проблемы с кракозябрами уже много-много лет.
 44
BY V.Stepan #01.12.2016 20:28  @Balancer#01.12.2016 20:00
+
-
edit
 

V.Stepan

аксакал
★★☆
Balancer> Тексты только на русском (в рамках категории данных в целом) .... Начиная с французского в произведениях Толстого

Какой же это "только русский"? :eek:

Balancer> кончая банальной русской типографикой в любимом тобой КОИ-8 (где даже символа номера № нет).

И это тоже не "только русский" — в русском алфавите такого символа нет. И любимый у меня CP866, потому что DOS/OS/2 :) .

Balancer> До сих пор массово гуляют mp3 с cp1251 в тегах, которые порождают постоянные проблемы с кракозябрами уже много-много лет.

Лень программистов для обеспечения подддержки многих кодовых таблиц, и ничего более. На самом деле не проблема.
"Класс – это исключение случайностей"  38.938.9
BY V.Stepan #01.12.2016 20:31  @Bredonosec#01.12.2016 19:54
+
+1
-
edit
 

V.Stepan

аксакал
★★☆
Bredonosec> блин, опять мимо )))
Bredonosec> сорри )))

Как гласит народная мудрость, "называй хоть горшком, только в печь не ставь" :)
"Класс – это исключение случайностей"  38.938.9
RU Balancer #01.12.2016 20:43  @V.Stepan#01.12.2016 20:28
+
-
edit
 

Balancer

администратор
★★★★★
V.Stepan> И это тоже не "только русский" — в русском алфавите такого символа нет.

В русском алфавите даже цифр нет.

Ладно, проехали.
 44
BY V.Stepan #01.12.2016 20:48  @Balancer#01.12.2016 20:43
+
-
edit
 

V.Stepan

аксакал
★★☆
Balancer> В русском алфавите даже цифр нет.

Если так ставить вопрос, то числа и словами прекрасно записываются. Для чтения текстов это большой проблемой не станет.

Balancer> Ладно, проехали.

Я ж не спорю :) . Проехали — так проехали.
"Класс – это исключение случайностей"  38.938.9
RU Balancer #01.12.2016 20:56  @V.Stepan#01.12.2016 20:48
+
-
edit
 

Balancer

администратор
★★★★★
V.Stepan> Если так ставить вопрос, то числа и словами прекрасно записываются.

Ага зпт и знаки препинания тоже тчк

Троллинг прощаю в последний раз.
 44
BY V.Stepan #01.12.2016 20:58  @Balancer#01.12.2016 20:56
+
-
edit
 

V.Stepan

аксакал
★★☆
Balancer> Троллинг прощаю в последний раз.

Ну, я вообще-то троллинг с твоей стороны наблюдал, но хорошо — я троллю. Пусть будет так :(
"Класс – это исключение случайностей"  38.938.9
+
-
edit
 

digger

аксакал

Balancer> Этот момент я озвучивал. Тексты только на русском (в рамках категории данных в целом) — это сразу порождение проблем. Начиная с французского в произведениях Толстого

Решение - переключать кодировки, если хочется кодировать Юникод на весь русский текст с одной латинской буквой.Есть ли простой, легкий и компактный стандарт формата с переключением кодировок внутри текста (не rtf)?
 54.0.2840.9954.0.2840.99
+
-
edit
 

Balancer

администратор
★★★★★
digger> Решение - переключать кодировки

Очень кривое решение. Лишняя сущность и не позволяет использовать смешанные тексты.

digger> Есть ли простой, легкий и компактный стандарт формата с переключением кодировок внутри текста

Ага. utf-8 :)
 44
+
-
edit
 

digger

аксакал

Balancer> Очень кривое решение. Лишняя сущность и не позволяет использовать смешанные тексты.
digger>> Есть ли простой, легкий и компактный стандарт формата с переключением кодировок внутри текста
Balancer> Ага. utf-8 :)

Уникод - более кривое и менее экономное решение кодировать каждую букву по отдельности в значение до 32 бит, неважно как.Если переключать кодировки, то блок некитайского текста на том же языка кодируется 8 бит на букву.Хотя памяти много, Интернет быстрый, тексты занимают немного по сравнению с остальным, можно кодировать хоть неупакованной 4-х битовой цифрой каждую букву и никто не заметит.UTF-8 удобен только тем,что он принтабелен и это имеет смысл,если он вставлен куда-то, а не в отдельном файле, либо 90% текста английский и его читают как ASCII.
 54.0.2840.9954.0.2840.99
Это сообщение редактировалось 05.12.2016 в 19:16
RU Alexandrc #15.12.2016 18:20  @Balancer#04.12.2016 18:24
+
+1
-
edit
 

Alexandrc

аксакал

digger>> Решение - переключать кодировки
Balancer> Очень кривое решение. Лишняя сущность и не позволяет использовать смешанные тексты.
digger>> Есть ли простой, легкий и компактный стандарт формата с переключением кодировок внутри текста
Balancer> Ага. utf-8 :)

А как же переключение контроловыми символами? Как было еще во времена RT11 и еще ранее? Перед латинской буквой вставлялся CTRL+O потом CTRL+N для переключения на русский. Причем русских было несколько: три варианта КОИ-7 и КОИ-8. Угадать, не зная какой знакогенератор стоял на конкретном устройстве, было трудно, но текст можно было читать в псевдо-транслите, просто игнорируя символы-переключатели. А вот вместо псевдографики частенько были - "кракозяблы". Потому мы занимались адаптацией программ с КОИ-8, заменяя псевдографику ascii символами.
Но вы там держитесь!  55.0.2883.8755.0.2883.87
+
-
edit
 

Kuznets

Клерк-старожил
★☆
V.Stepan> И любимый у меня CP866, потому что DOS/OS/2 :) .

за одно только отсутствие знаков евро и проч. их надо было давно запретить :D

пс проблема старых кодировок (и прочего старого) на мой взгляд непрофессионального специалиста - что когда разработчик меняется (а они рано или поздно всегда меняются) то все работает только до того момента пока не потребуются изменения. это слишком большой риск.
 50.050.0
+
-
edit
 

imaex

опытный

Balancer>> кончая банальной русской типографикой в любимом тобой КОИ-8 (где даже символа номера № нет).
V.Stepan> И это тоже не "только русский" — в русском алфавите такого символа нет.
Зато есть в русском делопроизводстве. Точно такой же стандарт, как # у америкосов.

V.Stepan> И любимый у меня CP866, потому что DOS/OS/2 :) .

Жесть жестянская! Как это можно любить?
 49.0.2623.11249.0.2623.112
+
-
edit
 

V.Stepan

аксакал
★★☆
imaex> Жесть жестянская! Как это можно любить?

Легко! Первая любовь не ржавеет!
"Класс – это исключение случайностей"  45.945.9

в начало страницы | новое
 
Поиск
Настройки
Твиттер сайта
Статистика
Рейтинг@Mail.ru