Windows 1251 კოდირების ცხრილების კოდირების მხარის დაზიანება

3 ხმა

გამარჯობა, ჩემი ბლოგის მკითხველებო. დღეს ჩვენ გესაუბრებით კოდირების შესახებ. თუ თქვენ წაიკითხეთ ჩემი სტატია მათ შესახებ, იცით, რომ ინტერნეტში არსებული ნებისმიერი დოკუმენტი არ არის შენახული იმ ფორმით, რომელშიც მას ვუწოდეთ. სხვა სულელი ადამიანების ჩანაწერებიდან, სიმბოლოები და ნიშნები. ტექსტი იგივეა.

ბევრი კოდირებაა ჩართული და ზოგიერთი სულელური სიმბოლო, რომელიც გამოჩნდება წიგნის გახსნისას მობილური აპლიკაციაან სტატიის საიტზე ატვირთვით და პარამეტრებში მნიშვნელობების შეცვლით, პირველად შეისწავლით ანბანს.


კოდირება windows-1251 - რას ნიშნავს საიტი, რა სიმბოლოები იქნება ხელმისაწვდომი და რა მოხდება უკეთესი გადაწყვეტილებებისთვისდღეისთვის? ყველაფრის შესახებ დღევანდელ სტატისტიკაში. როგორც ადრე, ჩემი უბრალო სიტყვებით, რაც შეიძლება ნათლად და ტერმინების მინიმალური რაოდენობით.

პატარა თეორია

დოკუმენტი არის კომპიუტერზე თუ ინტერნეტში, როგორც უკვე ვთქვი, ის ინახება ორმაგი კოდის სახით. მაგალითად, თუ ვიკორისტი ხარ ASCII კოდიშემდეგ ასო "K" დაიწერება როგორც 10001010, ხოლო Windows +1251 ამ ნომრის ქვეშ არის სიმბოლო - C ™. იმ შემთხვევაში, თუ თქვენი ბრაუზერი ან პროგრამა გაფართოვდება სხვა ცხრილზე და პატივს სცემს ASCII-ს კოდი ფანჯრები 1251, მაშინ მკითხველი წაიკითხავს აბსოლუტურად არაცნობიერ სიმბოლოს.

უფრო ლოგიკურია, რატომ შეგეძლოთ გაერკვნენ ცხრილი კოდებით? მარჯვნივ არის ის, რომ რუსული ანბანის გარდა ასევე არის ინგლისური, გერმანული და ჩინური. ყველა ვარაუდის მიღმა 200000-მდე პერსონაჟია. თუმცა, მე არც კი ვენდობი ამ სტატისტიკას, როცა ვფიქრობ იაპონურზე.

არ დაგავიწყდეთ, რომ დიდი და პატარა ასოებისთვის თქვენ უნდა შეადგინოთ საკუთარი კოდი, მძიმეები, ტირეები და ა.შ.

რაც უფრო მეტი სიმბოლოა ცხრილში, მით უფრო მაღალია თითოეული მათგანის კოდი, რაც ნიშნავს, რომ დოკუმენტის ღირებულება უფრო დიდი ხდება.


როგორც ჩანს, ერთი წიგნი 4 GB ღირდა! დიდი ხანი იქნებოდა შეპყრობილი, ყველაფერი ისესხა vilne misceკომპიუტერზე. გადახტომის შესახებ გადაწყვეტილება რთული იქნებოდა.

როგორც კი საიტებზე დავფიქრდი, შემეშინდა იმაზე ფიქრი, რა მოხდებოდა. კანის მხარე გაიხსნა შვეიცარიული ოპტიკის ბოლომდე! იფიქრე, მობილური ტელეფონებიშეგეძლო კეთილგანწყობა გამომყარო. უნდა შეგაწუხოთ ისინი ქუჩაში 4G-ის გამოყენებით? Ვეჭვობ.

ამ მიზეზების გამო, პროგრამისტმა მაშინვე გადაწყვიტა შეექმნა საკუთარი სიმბოლოების ცხრილი. ასე რომ, თქვენთვის ადვილია თქვენი მუშაობის გაუმჯობესება და მისი ოპტიმალური შენარჩუნება.

მაგალითად, Microsoft-მა შექმნა windows-1251 რუსული საკომუნიკაციო სეგმენტისთვის. მას, რა თქმა უნდა, აქვს თავისი აღმავლობა და ვარდნა. ნებისმიერი სხვა პროდუქტის მსგავსად.

ამჟამად ინტერნეტში ყველა გვერდის 2%-ზე ნაკლები იწერება 1251 წელს. ვებმასტერების უმეტესობა იყენებს UTF-8-ს. Რატომ ასე?

ნაკლოვანებები და ღირსება

UTF-8, Windows-1251-ის ქვეშ არის უნივერსალური კოდირება, ის შეიცავს სხვადასხვა ანბანის ასოებს. ეს არის UTF-128, რომელიც მოიცავს ყველა ენას - ტეული, სუაჰილი, ლაოსური, მალტური და ა.შ.


UTF-8 ცუდია, ასოები გაცილებით ნაკლებ ადგილს იკავებს და მეხსიერების მხოლოდ ერთ ბაიტს იკავებს, როგორც 1251 წელს. UTF-ს აქვს იშვიათი სიმბოლოები სხვა წყაროებიდან. სპეციალური პერსონაჟები. მნიშვნელოვანია გვახსოვდეს 5-6 ბაიტი, მაგრამ ძალიან იშვიათია ისინი დოკუმენტებში.

ეს კოდირება უფრო გააზრებულია და, შესაბამისად, უფრო მეტი უპირატესობაა განხორციელებისთვის. თუ პროგრამას არ უთხარით, რომ კოდირებთ, პირველი რაც უნდა გააკეთოთ არის თავად შეამოწმოთ UTF-8.

როცა ქმნი html დოკუმენტისაიტისთვის, მაშინ ბრაუზერებს ეუბნებით, რომ გამოიყენონ ეს ცხრილი, რათა პატივი სცენ ჩანაწერების გაშიფვრისას.

ამისათვის თქვენ უნდა ჩაწეროთ შემდეგი ინფორმაცია head tag-ში. სიმბოლოების „charset ="-ის შემდეგ გადადით UTF ან Windows, როგორც ქვემოთ მოცემულ აპლიკაციაში.

<მეტა http-equiv = "შინაარსის ტიპი" შინაარსი = "Text/html;charset=windows-1251">


თუ მომავალში გსურთ დაიმახსოვროთ და ჩადოთ ალბანური ფრაზა ამ დეკოდირების ცხრილში, ვერაფერს ნახავთ, მიუხედავად იმისა, რომ თქვენი ენის კოდირება მას არ უჭერს მხარს. UTF-8 ამის საშუალებას მოგცემთ უპრობლემოდ.

თუ თქვენ მოგხიბლათ საიტის სწორად შექმნით, მაშინ შემიძლია გირჩიოთ მიხაილ რუსაკოვის კურსი. საიტის შექმნა და პოპულარიზაცია A-დან Z-მდე ».



ბევრი რამ გაქვთ სასწავლი - 256 გაკვეთილი კოდირების, JavaScript-ისა და XML-ის შესახებ. ჩვენი პროგრამირების საშუალებით თქვენ გესმით, თუ როგორ უნდა მოახდინოთ საიტის მონეტიზაცია, რათა მიიღოთ მეტი და მეტი მოგება. ერთ-ერთი იმ რამდენიმე კურსიდან, რომელშიც ყველაფერი რაც საჭიროა, ასე დეტალურად იქნება ახსნილი.

მე თვითონ უკვე ვიწყებ დაწყებას ბლოგერების სკოლაში ალექსანდრე ბორისოვი . საათზე მეტი სჭირდება, დასასრული და ზღვარი ჯერ არ ჩანს, მაგრამ არანაკლებ ამომწურავი და მოწესრიგებულია. მოტივირებულია განაგრძოს ზრდა.

ისე, თუ საჭმელს უჭირთ, ინტერნეტში ხუმრობა არ არის საჭირო. ზავჟდა კომპეტენტური მენტორია.



ვისურვებდი, რომ მათი ნახვა შემეძლო. კოდუვანს მივუბრუნდეთ.

ბაზი ბანიხი

როცა php-ზე ვსაუბრობ, ყველა საშინლად იწყებს სიცილს. მას შემდეგ რაც უკვე გავიგე მონაცემთა ბაზის შესახებ, ვაპირებ ვებგვერდის გამოყენებას საიტის მუშაობის დასაჩქარებლად. დარწმუნდით, რომ არ შეგაწუხებთ მათ, თუ არ არის საჭირო, რომ გადაცემული საიტი გახდეს არადამაკმაყოფილებელი.

დასაკეცი მანქანებს იყენებს ყველა, არ აქვს მნიშვნელობა რა დონის სამუშაო, გამოცდილება და მომსახურება გაქვთ. მონაცემთა ბაზის გვერდები შეიძლება შეიცავდეს Windows 1251-ის ყველა შესაძლო სიმბოლოს, მაგალითად, გვერდების შაბლონებში, სხვა კოდირებაში.

სანამ გადაცემა არ არის საჭირო, ყველაფერი მუშაობს და ფუნქციონირებს, თუმცა არა მთლად სწორად. მაგრამ გადაადგილების შემდეგ, უხერხულობა იწყება. იდეალურ შემთხვევაში, თქვენ ხართ დამნაშავე vikorystvat ან UTF ან Windows-1251, მაგრამ სინამდვილეში, ამიერიდან, ყველას ექნება ასეთი ნაკლოვანებები.

მის გასაშიფრად, თქვენ უნდა შეიყვანოთ mysql_query კოდი (“SET NAMES cp1251”). ამ შემთხვევაში ტრანსფორმაცია განხორციელდება სხვა პროტოკოლის მიხედვით - cp1251.


Htaccess

მას შემდეგ, რაც საიტზე თქვენ გულმოდგინედ აქვეყნებდით vikoristuvat თავს 1251, მაშინ უნდა იცოდეთ ან შექმნათ htaccess ფაილი. ეს მიუთითებს კონფიგურაციის პარამეტრებზე. მას მოუწევს კიდევ სამი რიგის დამატება, რათა ყველაფერი გამოვიდეს.

DefaultLanguage ru; AddDefaultCharset windows-1251; php_value default_charset "cp1251"

მე მაინც გირჩევთ, იფიქროთ UTF-8 ვიკიზე. ეს არის პოპულარული, მარტივი და მდიდარი. რა გადაწყვეტილებაც არ უნდა მიიღოთ დაუყოვნებლივ, მნიშვნელოვანია ამის გაკეთება, რათა მოგვიანებით ყველაფერი გამოსწორდეს. ბევრად უფრო ადვილი იქნება ამ კოდის გამოყენებით საიტზე ინგლისურენოვანი ვერსიის დამატება. არაფრის გამოსწორება არ არის საჭირო.

გადაწყვეტილება დაკარგა შენთვის. გამოიწერეთ საინფორმაციო ბიულეტენი, რათა იცოდეთ ვინ არის შვედი, წაიკითხეთ, რათა არ გაიმეოროთ სხვა ადამიანების კეთილგანწყობა და ასევე, როგორ მოხსნიან ბლოგერები მეტ თაღლითებს.

მალე გნახავთ და წარმატებებს გისურვებთ თქვენს მცდელობებში.

დღეების განმავლობაში მქონდა შანსი გადამეჭრა პატარა პრობლემა Denwer-ის ნაკრების უსიამოვნო ადაპტირებასთან UTF-8 კოდირებასთან დაკავშირებით. პრობლემა, გულწრფელად რომ ვთქვათ, როგორც ჩანს, დრიბ'იაზკოვა იყო და გაირკვა 15, 10 z-ზე, რომელიც Google-მა გადაიღო. ამ ეტაპზე, სხვადასხვა ფორუმების შემდეგ, აღვნიშნე, რომ ბევრი ადამიანი დიდხანს ვერ უმკლავდება ამ პრობლემას. გარდა ამისა, ცხადია, რომ ბევრმა ადამიანმა დაიწყო UTF-8-ის გამოყენება, რადგან Windows-1251-ის ასეთი „რუსული“ კოდირება შესანიშნავია. გადავწყვიტე რამდენიმე პოსტის დაწერა ამ თემაზე. დავიწყებ ამ კოდების დეტალური აღწერით და შემდეგ გავაგრძელებ, ყოველგვარი შეფერხების გარეშე, Denwer-ის პაკეტზე UTF-8 კორუფციის მიმდინარე პრობლემის აღწერით.

არც ისე დიდი ხნის წინ, განვითარებულ პირობებთან დაკავშირებით, მათ გადაწყვიტეს გადასულიყვნენ Windows-1251 კოდირებაზე, რასაც დიდი ხნის განმავლობაში აკეთებდნენ და მთლიანად და მთლიანად გადაერთნენ UTF-8-ზე. მე არ გავამხელ გადასვლის ყველა მიზეზს, მაგრამ მთავარს:

  • მასზე მუშაობს დღევანდელი ვებ პლატფორმების უმეტესობა;
  • მარტივია რესურსების გამოყენება მდიდარი პროექტების შესაქმნელად;
  • კოდირებაში გამოყენებული სიმბოლოების რაოდენობა უახლოვდება 100000-ს;
  • კოდი უნივერსალურია, ამიტომ რუსები დაკარგავენ რუსულ სიმბოლოებს ნიკარაგუაში.

პატარა თეორია

Windows-1251 - სიმბოლოების ნაკრები და კოდირება, რომელიც არის სტანდარტული 8-ბიტიანი კოდირება ყველა რუსული ვერსიისთვის Microsoft Windows. ის ცდილობს მიაღწიოს დიდ პოპულარობას. Windows-1251 აშკარად გამოირჩევა სხვა 8-ბიტიანი კირილიცული კოდებისგან (როგორიცაა CP866, KOI8-R და ISO 8859-5) თითქმის ყველა სიმბოლოს არსებობით, რომლებიც გამოიყენება რუსულ ტიპოგრაფიაში ტექსტის გარეშე; თქვენ ასევე შეგიძლიათ შეცვალოთ რუსულთან ახლოს მყოფი ენების ყველა სიმბოლო: უკრაინული, ბელორუსული, სერბული და ბულგარული.

UTF-8 - კოდირება ახლა გაფართოვდა უნიკოდის წარმოდგენის განსახორციელებლად, 8-ბიტიანი ტექსტის კოდირების ჩათვლით. ვიცოდი, რომ ფართო სტაგნაცია იყო ოპერატიული სისტემადა ვებ სივრცე. ტექსტი, რომელიც შედგება მხოლოდ 128-ზე ნაკლები უნიკოდის სიმბოლოებისგან, გარდაიქმნება სუფთა ASCII ტექსტად UTF-8-ში დაწერისას. Unicode სიმბოლოების ნაკრები ნაჩვენებია თანმიმდევრობით, რომელიც მერყეობს 2-დან 6 ბაიტამდე.

კოდირების ძირითადი ფუნქციები

კოდირების მთავარი პასუხისმგებლობა სიმბოლოების შერჩევაა. UTF-8-ში შეგიძლიათ მიიღოთ ბევრად მეტი სიმბოლო, ვიდრე Windows-ში - 1251. Windows-ის კოდი არის ათას ორას ორმოცდათერთმეტი ერთი ბაიტი, ამიტომ მასში მხოლოდ 255 სიმბოლო შეიძლება იყოს ნაჩვენები. კირიული ანბანისთვის, რომელიც სრულიად საკმარისია, დოსის ერთბაიტიანი კოდირება ძალიან მასიური გახდება.

UTF-8-ში დაშიფრული სიმბოლო შეიძლება იყოს კოდირებული 6 ბაიტით (ამჟამად მხოლოდ 4 არის გამოკვლეული და მეტი არ არის დაგეგმილი). მაგალითად, რუსული ენისთვის სიმბოლოს 2 ბაიტი სჭირდება. ყველა სიმბოლო, რომელიც არის სიმბოლოების ცხრილში, ექვემდებარება ამ დაშიფვრას. მაგალითად, თუ გჭირდებათ საავტორო უფლებების სიმბოლო (©), მაშინ არ გჭირდებათ სპეციალური შრიფტის შექმნა ან სიმბოლოების ჩვენება გრაფიკულ ფორმატში.

UTF-8-ის დადებითი მხარეები:

  • UTF-8 საშუალებას გაძლევთ მყისიერად იმუშაოთ ტექსტის დამმუშავებლებთან, რათა ნახოთ ტექსტები, რომლებიც შეიცავს სიმბოლოებს სხვადასხვა ანბანიდან და იეროგლიფებიდან. კოდების დახმარებით ათას ორას ორმოცდათერთმეტი არ შეიძლება;
  • UTF-8 ვიკი გაძლევთ საშუალებას ნახოთ კოდის ცხრილი, სიმბოლოების თარგმნა და ყველა სხვა პრობლემა, რომელიც ადრე იყო ერთბაიტიანი კოდირებით;
  • არ არსებობს ერთი და იგივე ფილმის კოდის ყიდვის საშუალება, როგორც ადრე იყო რუსულისთვის: cp1251, cp866, koi8r, iso8859-5.

UTF-8 მინუსები ...

და რატომ არის ამ ღუმელის სუნი? მე ვიცი მხოლოდ რამდენიმე მითი და ლეგენდა ამ თემაზე, მათი მთავარია: „UTF-8-ს აქვს პრობლემები ძველ ბრაუზერებთან“ - ნაკლებად სავარაუდოა... ყოველ შემთხვევაში, თუ ძველები არ სცემენ პატივს Lynx-ს და Mosaic-ს _) ; ”UTF-8 იწვევს პრობლემებს სერვერზე” - კარგი, დიახ, რადგან სერვერი იძულებულია სხვა კოდირების ინტერპრეტაცია მოახდინოს. ალე ცე არ არის მინუს კოდი, რა თქმა უნდა...

ვებსაიტის შემქმნელს ყოველთვის ექმნება პრობლემა: რა კოდით შექმნას პროექტი. რუსულ ინტერნეტში გამოიყენება ორი კოდი:

UTF-8(Ინგლისური ვერსია) უნიკოდის ტრანსფორმაციის ფორმატი) - კოდირება ახლა გაფართოვდა უნიკოდის წარმოდგენის განსახორციელებლად, 8-ბიტიანი ტექსტის კოდირების ჩათვლით.

Windows-1251(ან cp1251) - სიმბოლოების ნაკრები და კოდირება, რომელიც არის სტანდარტული 8-ბიტიანი კოდირება Microsoft Windows-ის ყველა რუსული ვერსიისთვის.

UTF-8 უფრო პერსპექტიულია. თუმცა, ნებისმიერ მეტყველებას აქვს ნაკლოვანებები. და გადაწყვეტილება მხოლოდ იმ ფაქტის მანკიერი ინტერპრეტაციის შესახებ, რომ ის პერსპექტიულია, ბევრი სხვა ფაქტორის განხილვის გარეშე, არ ჩანს სწორი. არჩევანი ოპტიმალური იქნება მხოლოდ იმ შემთხვევაში, თუ იგი მოიცავს კონკრეტული პროექტის ყველა ნიუანსს. მარჯვნივ, ადვილი არ არის ყველა ნიუანსის გადმოცემა.

ჩვენ ვაფასებთ, რომ UTF-8 ვერსია უკეთესია, მაგრამ თქვენ უნდა აირჩიოთ პროექტის მენეჯერი მარჯვნივ. და თქვენი არჩევანის გასაადვილებლად, იხილეთ ორივე კოდის მახასიათებლების დეტალური ცხრილი.

ძალა UTF-8 Windows-1251
იდუმალი პერსონაჟი
Სიმდიდრე კოდირება საშუალებას გაძლევთ შეცვალოთ სხვადასხვა ენა, როგორც საჯარო, ასევე საიტის ადმინისტრაციულ ნაწილში.
  • ღირსეული ვებსაიტის კოდირების შეცვლა Windows-1251-დან UTF-8-ზე შეიძლება გამოიწვიოს სერიოზული დამატებითი შრომითი და ფინანსური ხარჯები.
  • რუსული და ინგლისური უპრობლემოდ იმუშავებს Windows-1251-თან, რადგან მათ ნამდვილად არ დასჭირდებათ სხვა ენები და არ არის საჭირო UTF-8.
სიმბოლოების რაოდენობა დიდია. სპეციალური სიმბოლოების შერჩევის შესაძლებლობა. ე. თქვენ ასევე უნდა შეამოწმოთ თქვენი ბრაუზერის შესაძლებლობები. ჩვეულებრივ ჩუმად არის. შესაძლებელია სპეციალური სიმბოლოების ჩანაცვლება „მილიციით“, მაგალითად, © & сory; ან × (გამრავლების ნიშანი) &Times;-ზე. თუმცა, ეს აუმჯობესებს კონტენტის მენეჯერის მომზადების დონეს და ქმნის პრობლემებს მონაცემთა სხვა მონაცემთა ბაზიდან გადაცემისას. გარდა ამისა, Bitrix Framework-ში არის ველები, რომლებსაც არ იყენებს ვიზუალური რედაქტორი, მაგალითად, გვერდის სახელი ან Infoblock ელემენტის სახელი. ეს ასევე ართულებს პროექტის მხარდაჭერას დაბალი კვალიფიკაციის მქონე მუშაკებით.
რობოტის სიჩქარე
  • საიტზე მუშაობისას რობოტის ყველა ფუნქცია იცვლება რიგებში mb_*. ეს ნიშნავს, რომ მთელი ტექსტი გადაიქცევა საიტის კოდად.
  • utf strlenდაწექი მწკრივის ბოლოში, აშკარად პირველადი strlenის მუშაობს 3-ჯერ მეტი, ვიდრე მულტიბაიტი: 0.0004 წინააღმდეგ 0.0013 ათასობით გამეორებისთვის. ვირტუალური საიტებისთვის რეალური საიტის მუშაობაში 10-15%-იანი სხვაობაა.
პროექტის მინიმიზაცია. UTF-8-ზე პროექტი აშკარად "უფრო მნიშვნელოვანი" იქნება, იმის გამო, რომ მის კოდირებაში სტრიქონები ორჯერ მეტ ადგილს იკავებს, ვიდრე სტრიქონები ერთ ბაიტიან Windows-1251-ში. საიტისა და მონაცემთა ბაზის ზომა იქნება 1.2 - 1.5-ჯერ დიდი.
js ჩარჩოების უმეტესობის მხარდაჭერა მიმართეთ უპრობლემოდ. დასაკეცი დანადგარები წარმოებაშია.
მხარდაჭერა MS SQL უკან ტექნიკური მიზეზები, დანი შემოვიდა MS SQLდანაშაული შენახულია და შენახულია Windows-1251-ში. საჭიროა დამატებითი პარამეტრები. პრობლემები არ არის.
CSV იმპორტი Excelარ არის შენახული UTF-8-ში. აუცილებელია შექმნილი ფაილის ხელახლა შენახვა თქვენს კოდში სხვა რედაქტორის გამოყენებით. პრობლემები არ არის.
იმპორტი 1C-დან UTF-8-ში დაწერილი ვებსაიტები უპრობლემოდ მუშაობენ, როდესაც ინტეგრირებულია საპონიისეთი სისტემებით, როგორიცაა, მაგალითად, 1C.
Webvisor Yandex.Metrics ვებ მაყურებელი სწორად აღრიცხავს ტრეიდერების საქმიანობას. შესაძლოა დაწეროთ თქვენი უპირატესობები.
დაკავშირებულია Bitrix Framework
ვებსაიტების შექმნის შესაძლებლობა სხვადასხვა კოდით Multisite სისტემის გამოყენებით. შეუძლებელია. ყველა საიტი ერთსა და იმავე ბირთვზე ექვემდებარება ერთსა და იმავე კოდს.
მხარდაჭერა სხვადასხვა ჰოსტინგებზე Bitrix Framework-თან მუშაობისას თქვენ უნდა ჩართოთ php ვარიანტი mbstring.func_overloadმეტი ან ნაკლები 2 . ცე. იმუშავეთ ნებისმიერ ჰოსტინგზე.
პროდუქციის განთავსება ვირტუალური ხელსაწყო BitrixVM. მოდი ჩავიცვათ. ხილული დამატებითი მოქმედებები კორექტირებიდან.
მენიუს ელემენტების სწორი ჩვენება საიტზე თუ ამ კოდს შეცვლით, ეს პრობლემა შესაძლებელია. როგორც ჩანს, კანის ფაილი ხელახლა ინახება UTF-8-ში. (ზუსტად, მიზანშეწონილია შეამოწმოთ ყველა ფაილის კოდირება და არა მხოლოდ მენიუში არსებული ფაილები და, საჭიროების შემთხვევაში, ხელახლა დაშიფვრა.)
მაგალითად, სპამის კოდების იმპორტი IDE-ში დაბნელება pdt როდესაც პარამეტრებში პროექტი დაყენებულია UTF-8-ზე, კომენტარები ემატება Bitrix Framework-ის ძირითად კოდს. პრობლემები არ არის.
სხვადასხვა ტიპის შენობები
ურთიერთქმედება WordPress(ბლოგის კლიენტები, ტრეკბექი და პინგ "i) є აქ არ არის
ფაილების რედაქტირება მიერ FTPმეშვეობით შორს FAR მხარს უჭერს UTF-ს მხოლოდ 2.0 ვერსიიდან. ალბათ
მეტი რედაქტორების მხარდაჭერა თქვენ გჭირდებათ რედაქტორი, რომელიც მხარს უჭერს UTF-8 კოდირებას BOM-ის გარეშე. პრობლემები არ არის.

როგორ გადაიყვანოთ win1251 ვებსაიტი UTF-8-ად

მოქმედებების თანმიმდევრობა:

    1. გადაიყვანეთ მთელი მონაცემთა ბაზა UTF-8-ზე (საუკეთესო ვარიანტია დაუკავშირდეთ სერვერის ადმინისტრატორს დახმარებისთვის).

    2. გადაიყვანეთ საიტზე არსებული ყველა ფაილი UTF-8-ად (ეს შეგიძლიათ თავად გააკეთოთ).

    3. დაამატეთ რიგები ფაილს /bitrix/php_interface/dbconn.php:

define ("BX_UTF", true);

4. დაამატეთ რიგები /.htaccess ფაილს:

Php_value mbstring.func_overload 2 php_value mbstring.internal_encoding UTF-8

თქვენ შეგიძლიათ დააკონვერტიროთ საიტზე არსებული ყველა ფაილი UTF-8-ში (სხვა წერტილი) ბრძანების გაშვებით SSH-ის მეშვეობით საიტის ძირეულ საქაღალდეში:

იპოვე. -სახელი "*.php" -ტიპი f -exec iconv -fcp1251 -tutf8 -o /tmp/tmp_file()\; -exec mv/tmp/tmp_file()\;

Windows 1251 კოდირება შეიქმნა 90 წლის განმავლობაში რუსიფიკაციისთვის პროგრამული პროდუქტებირა იწარმოება Microsoft Corporation-ის მიერ:

კოდირება არის 8-ბიტიანი და მოიცავს სლოვენური ჯგუფების სიმბოლოებს, რომლებიც მოიცავს რუსულ, ბელორუსულ, უკრაინულ, ბულგარულ, მაკედონიურ, სერბულ ენებს - რაც მას უპირატესობას ანიჭებს სხვა კირილიცას დაშიფვრებს ( ISO 8859-5, KOI8-R, CP866). თუმცა, 1251-კოდირებას აქვს გარკვეული ხარვეზები:

  • 0xFF (25510) - ეს არის დაჯავშნის კოდი სიმბოლო "I". პროგრამები, რომლებიც არ უჭერენ მხარს წმინდა მე-8 ბიტს, ხშირად განიცდიან გაუთვალისწინებელ პრობლემებს;
  • არ არსებობს ფსევდოგრაფიკა, როგორც ეს არის KOI8, CP866.

ჩამოწიეთ სიმბოლოები Code Page 1251-დან ან შეამცირეთ CP1251 ( ნომრები სიმბოლოების ქვეშ და კოდი იმავე სიმბოლოს თექვსმეტობით სისტემაში უნიკოდში):


ხშირად სხვადასხვა კვალიფიკაციის მქონე ვებ დეველოპერებსა და ბლოგერებს აწყდებათ გვერდების კოდირების პრობლემა: მომზადებული ტექსტის ნაცვლად უხილავი, წაუკითხავი სიმბოლოებია. ამ პრობლემის მოსაგვარებლად აუცილებელია ტერმინის არსის გაგება " გვერდის კოდირება».

კომპიუტერის მეხსიერებაში ტექსტი ინახება მრავალი ბაიტის სახით და არა იმ ფორმით, რომელშიც ის არის ნაჩვენები ტექსტის რედაქტორი. თითოეული ბაიტი არის კოდი, რომელიც შეესაბამება ერთ სიმბოლოს. იმისთვის, რომ გვერდზე ტექსტი კვალის სახით გამოჩნდეს, ბრაუზერს უნდა აცნობოთ, რომ ღვინოების გაშიფვრისა და ჩვენების კოდების ცხრილი უნდა შეიცვალოს.

კოდირების ცხრილი არ არის უნივერსალური, ამიტომ ტექსტის გაშიფვრისთვის აუცილებელია აირჩიოთ ის, რომელიც წარმოადგენს დაშიფრულ სიმბოლოებს:


იმისათვის, რომ HTML დოკუმენტი ბრაუზერში სწორად იყოს ნაჩვენები, საჭიროა სწორი კოდირების შეყვანა. სცადეთ ეს გზა:

ტეგს შორის და ხურავსსაჭიროა რეგისტრაცია - ამ მწკრივის მიღმა ბრაუზერი შეარჩევს რუსული ანბანის სიმბოლოებს გვერდზე ტექსტის საჩვენებლად.

Windows 1251 კოდირება PHP-ზე

არავისთვის არ არის საიდუმლო, რომ გვერდების გენერაცია გადის მონაცემთა ბაზაში შენახული ნებისმიერი ინფორმაციის შერჩევისა და შერჩევის პროცესს. ვებსაიტის PHP-ში წერისას ყველაზე ხშირად ეს არის mysql.