Programowanie

UTF-8

UTF-8

UTF-8 - system kodowania Unicodu.

Spis treści

[edytuj] Zalety i wady

Zalety

Wady

[edytuj] Sposób kodowania

Mapowanie znaków Unikodu na ciągi bajtów:

Niestety oznacza to, że ten sam znak można zapisać na kilka sposobów. Przykładowo znak ASCII / (ukośnik) można zapisać jako:

Stanowi to zagrożenie bezpieczeństwa m.in. dla serwerów, które sprawdzają obecność znaku / w ścieżkach.

Standard UTF-8 przewiduje, że każdy program MUSI odrzucać wszystkie znaki zapisane sekwencjami dłuższymi niż minimalna.

Problemu tego można byłoby uniknąć, przy okazji skracając nieznacznie długość danych, jeśli wykorzystano by zasadę przesunięć typu:

[edytuj] Zobacz też

[edytuj] Linki zewnętrzne