Transliterate.php 2.0 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364
  1. <?php
  2. /**
  3. * @package koseven/Codebench
  4. * @category Tests
  5. * @author Geert De Deckere <geert@idoe.be>
  6. */
  7. class Bench_Transliterate extends Codebench {
  8. public $description =
  9. 'Inspired by:
  10. http://koseven.discourse.group/comments.php?DiscussionID=6113';
  11. public $loops = 10;
  12. public $subjects = [
  13. // ASCII
  14. 'a', 'b', 'c', 'd', '1', '2', '3',
  15. // Non-ASCII
  16. 'à', 'ô', 'ď', 'ḟ', 'ë', 'š', 'ơ',
  17. 'ß', 'ă', 'ř', 'ț', 'ň', 'ā', 'ķ',
  18. 'ŝ', 'ỳ', 'ņ', 'ĺ', 'ħ', 'ṗ', 'ó',
  19. 'ú', 'ě', 'é', 'ç', 'ẁ', 'ċ', 'õ',
  20. 'ṡ', 'ø', 'ģ', 'ŧ', 'ș', 'ė', 'ĉ',
  21. 'ś', 'î', 'ű', 'ć', 'ę', 'ŵ', 'ṫ',
  22. 'ū', 'č', 'ö', 'è', 'ŷ', 'ą', 'ł',
  23. 'ų', 'ů', 'ş', 'ğ', 'ļ', 'ƒ', 'ž',
  24. 'ẃ', 'ḃ', 'å', 'ì', 'ï', 'ḋ', 'ť',
  25. 'ŗ', 'ä', 'í', 'ŕ', 'ê', 'ü', 'ò',
  26. 'ē', 'ñ', 'ń', 'ĥ', 'ĝ', 'đ', 'ĵ',
  27. 'ÿ', 'ũ', 'ŭ', 'ư', 'ţ', 'ý', 'ő',
  28. 'â', 'ľ', 'ẅ', 'ż', 'ī', 'ã', 'ġ',
  29. 'ṁ', 'ō', 'ĩ', 'ù', 'į', 'ź', 'á',
  30. 'û', 'þ', 'ð', 'æ', 'µ', 'ĕ', 'ı',
  31. 'À', 'Ô', 'Ď', 'Ḟ', 'Ë', 'Š', 'Ơ',
  32. 'Ă', 'Ř', 'Ț', 'Ň', 'Ā', 'Ķ', 'Ĕ',
  33. 'Ŝ', 'Ỳ', 'Ņ', 'Ĺ', 'Ħ', 'Ṗ', 'Ó',
  34. 'Ú', 'Ě', 'É', 'Ç', 'Ẁ', 'Ċ', 'Õ',
  35. 'Ṡ', 'Ø', 'Ģ', 'Ŧ', 'Ș', 'Ė', 'Ĉ',
  36. 'Ś', 'Î', 'Ű', 'Ć', 'Ę', 'Ŵ', 'Ṫ',
  37. 'Ū', 'Č', 'Ö', 'È', 'Ŷ', 'Ą', 'Ł',
  38. 'Ų', 'Ů', 'Ş', 'Ğ', 'Ļ', 'Ƒ', 'Ž',
  39. 'Ẃ', 'Ḃ', 'Å', 'Ì', 'Ï', 'Ḋ', 'Ť',
  40. 'Ŗ', 'Ä', 'Í', 'Ŕ', 'Ê', 'Ü', 'Ò',
  41. 'Ē', 'Ñ', 'Ń', 'Ĥ', 'Ĝ', 'Đ', 'Ĵ',
  42. 'Ÿ', 'Ũ', 'Ŭ', 'Ư', 'Ţ', 'Ý', 'Ő',
  43. 'Â', 'Ľ', 'Ẅ', 'Ż', 'Ī', 'Ã', 'Ġ',
  44. 'Ṁ', 'Ō', 'Ĩ', 'Ù', 'Į', 'Ź', 'Á',
  45. 'Û', 'Þ', 'Ð', 'Æ', 'İ',
  46. ];
  47. public function bench_utf8($subject)
  48. {
  49. return UTF8::transliterate_to_ascii($subject);
  50. }
  51. public function bench_iconv($subject)
  52. {
  53. // Note: need to suppress errors on iconv because some chars trigger the following notice:
  54. // "Detected an illegal character in input string"
  55. return preg_replace('~[^-a-z0-9]+~i', '', @iconv('UTF-8', 'ASCII//TRANSLIT', $subject));
  56. }
  57. }