trie.test.ts 9.6 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349
  1. import { createTrie } from './trie';
  2. import { describe, it } from 'mocha';
  3. import { expect } from 'expect';
  4. // describe('hostname to tokens', () => {
  5. // it('should split hostname into tokens.', () => {
  6. // expect(hostnameToTokens('.blog.skk.moe')).toStrictEqual([
  7. // '.',
  8. // 'blog',
  9. // '.',
  10. // 'skk',
  11. // '.',
  12. // 'moe'
  13. // ]);
  14. // expect(hostnameToTokens('blog.skk.moe')).toStrictEqual([
  15. // 'blog',
  16. // '.',
  17. // 'skk',
  18. // '.',
  19. // 'moe'
  20. // ]);
  21. // expect(hostnameToTokens('skk.moe')).toStrictEqual([
  22. // 'skk',
  23. // '.',
  24. // 'moe'
  25. // ]);
  26. // expect(hostnameToTokens('moe')).toStrictEqual([
  27. // 'moe'
  28. // ]);
  29. // });
  30. // });
  31. describe('Trie', () => {
  32. it('should be possible to add domains to a Trie.', () => {
  33. const trie = createTrie(null, false);
  34. trie.add('a.skk.moe');
  35. trie.add('skk.moe');
  36. trie.add('anotherskk.moe');
  37. expect(trie.size).toBe(3);
  38. expect(trie.has('a.skk.moe')).toBe(true);
  39. expect(trie.has('skk.moe')).toBe(true);
  40. expect(trie.has('anotherskk.moe')).toBe(true);
  41. expect(trie.has('example.com')).toBe(false);
  42. expect(trie.has('skk.mo')).toBe(false);
  43. expect(trie.has('another.skk.moe')).toBe(false);
  44. });
  45. it('adding the same item several times should not increase size.', () => {
  46. const trie = createTrie(null, false);
  47. trie.add('skk.moe');
  48. trie.add('blog.skk.moe');
  49. // eslint-disable-next-line sukka/no-element-overwrite -- deliberately do testing
  50. trie.add('skk.moe');
  51. expect(trie.size).toBe(2);
  52. expect(trie.has('skk.moe')).toBe(true);
  53. });
  54. it('should be possible to set the null sequence.', () => {
  55. const trie = createTrie(null, false);
  56. trie.add('');
  57. expect(trie.has('')).toBe(true);
  58. const trie2 = createTrie(null, true);
  59. trie2.add('');
  60. expect(trie2.has('')).toBe(true);
  61. });
  62. it('should be possible to delete items.', () => {
  63. const trie = createTrie(null, false);
  64. trie.add('skk.moe');
  65. trie.add('blog.skk.moe');
  66. trie.add('example.com');
  67. trie.add('moe.sb');
  68. expect(trie.delete('')).toBe(false);
  69. expect(trie.delete('')).toBe(false);
  70. expect(trie.delete('example.org')).toBe(false);
  71. expect(trie.delete('skk.moe')).toBe(true);
  72. expect(trie.has('skk.moe')).toBe(false);
  73. expect(trie.has('moe.sb')).toBe(true);
  74. expect(trie.size).toBe(3);
  75. expect(trie.delete('example.com')).toBe(true);
  76. expect(trie.size).toBe(2);
  77. expect(trie.delete('moe.sb')).toBe(true);
  78. expect(trie.size).toBe(1);
  79. });
  80. it('should be possible to check the existence of a sequence in the Trie.', () => {
  81. const trie = createTrie(null, true);
  82. trie.add('example.org.skk.moe');
  83. expect(trie.has('example.org.skk.moe')).toBe(true);
  84. expect(trie.has('skk.moe')).toBe(false);
  85. expect(trie.has('example.org')).toBe(false);
  86. expect(trie.has('')).toBe(false);
  87. });
  88. it('should be possible to retrieve items matching the given prefix.', () => {
  89. const trie = createTrie(null, false);
  90. trie.add('example.com');
  91. trie.add('blog.example.com');
  92. trie.add('cdn.example.com');
  93. trie.add('example.org');
  94. expect(trie.find('example.com')).toStrictEqual(['example.com', 'blog.example.com', 'cdn.example.com']);
  95. expect(trie.find('com')).toStrictEqual(['example.com', 'blog.example.com', 'cdn.example.com']);
  96. expect(trie.find('.example.com')).toStrictEqual(['blog.example.com', 'cdn.example.com']);
  97. expect(trie.find('org')).toStrictEqual(['example.org']);
  98. expect(trie.find('example.net')).toStrictEqual([]);
  99. expect(trie.find('')).toStrictEqual(['example.com', 'example.org', 'blog.example.com', 'cdn.example.com']);
  100. });
  101. it('should be possible to retrieve items matching the given prefix even with a smol trie', () => {
  102. const trie = createTrie(null, true);
  103. trie.add('.example.com');
  104. trie.add('example.com');
  105. trie.add('blog.example.com');
  106. trie.add('cdn.example.com');
  107. trie.add('example.org');
  108. expect(trie.find('example.com')).toStrictEqual(['.example.com']);
  109. expect(trie.find('com')).toStrictEqual(['.example.com']);
  110. expect(trie.find('.example.com')).toStrictEqual(['.example.com']);
  111. expect(trie.find('org')).toStrictEqual(['example.org']);
  112. expect(trie.find('example.net')).toStrictEqual([]);
  113. expect(trie.find('')).toStrictEqual(['.example.com', 'example.org']);
  114. });
  115. it('should be possible to create a trie from an arbitrary iterable.', () => {
  116. let trie = createTrie(['skk.moe', 'blog.skk.moe'], false);
  117. expect(trie.size).toBe(2);
  118. expect(trie.has('skk.moe')).toBe(true);
  119. trie = createTrie(new Set(['skk.moe', 'example.com']), false);
  120. expect(trie.size).toBe(2);
  121. expect(trie.has('skk.moe')).toBe(true);
  122. });
  123. });
  124. describe('surge domainset dedupe', () => {
  125. it('should not remove same entry', () => {
  126. const trie = createTrie(['.skk.moe', 'noc.one'], false);
  127. expect(trie.find('.skk.moe')).toStrictEqual(['.skk.moe']);
  128. expect(trie.find('noc.one')).toStrictEqual(['noc.one']);
  129. });
  130. it('should match subdomain - 1', () => {
  131. const trie = createTrie(['www.noc.one', 'www.sukkaw.com', 'blog.skk.moe', 'image.cdn.skk.moe', 'cdn.sukkaw.net'], false);
  132. expect(trie.find('.skk.moe')).toStrictEqual(['blog.skk.moe', 'image.cdn.skk.moe']);
  133. expect(trie.find('.sukkaw.com')).toStrictEqual(['www.sukkaw.com']);
  134. });
  135. it('should match subdomain - 2', () => {
  136. const trie = createTrie(['www.noc.one', 'www.sukkaw.com', '.skk.moe', 'blog.skk.moe', 'image.cdn.skk.moe', 'cdn.sukkaw.net'], false);
  137. expect(trie.find('.skk.moe')).toStrictEqual(['.skk.moe', 'blog.skk.moe', 'image.cdn.skk.moe']);
  138. expect(trie.find('.sukkaw.com')).toStrictEqual(['www.sukkaw.com']);
  139. });
  140. it('should not remove non-subdomain', () => {
  141. const trie = createTrie(['skk.moe', 'sukkaskk.moe'], false);
  142. expect(trie.find('.skk.moe')).toStrictEqual([]);
  143. });
  144. });
  145. describe('smol tree', () => {
  146. it('should create simple tree - 1', () => {
  147. const trie = createTrie([
  148. '.skk.moe', 'blog.skk.moe', '.cdn.skk.moe', 'skk.moe',
  149. 'www.noc.one', 'cdn.noc.one',
  150. '.blog.sub.example.com', 'sub.example.com', 'cdn.sub.example.com', '.sub.example.com'
  151. ], true);
  152. expect(trie.dump()).toStrictEqual([
  153. '.skk.moe',
  154. 'www.noc.one',
  155. 'cdn.noc.one',
  156. '.sub.example.com'
  157. ]);
  158. });
  159. it('should create simple tree - 2', () => {
  160. const trie = createTrie([
  161. '.skk.moe', 'blog.skk.moe', '.cdn.skk.moe', 'skk.moe'
  162. ], true);
  163. expect(trie.dump()).toStrictEqual([
  164. '.skk.moe'
  165. ]);
  166. });
  167. it('should create simple tree - 3', () => {
  168. const trie = createTrie([
  169. '.blog.sub.example.com', 'cdn.sub.example.com', '.sub.example.com'
  170. ], true);
  171. expect(trie.dump()).toStrictEqual([
  172. '.sub.example.com'
  173. ]);
  174. trie.add('.sub.example.com');
  175. expect(trie.dump()).toStrictEqual([
  176. '.sub.example.com'
  177. ]);
  178. });
  179. it('should create simple tree - 3', () => {
  180. const trie = createTrie([
  181. 'commercial.shouji.360.cn',
  182. 'act.commercial.shouji.360.cn',
  183. 'cdn.creative.medialytics.com',
  184. 'px.cdn.creative.medialytics.com'
  185. ], true);
  186. expect(trie.dump()).toStrictEqual([
  187. 'commercial.shouji.360.cn',
  188. 'cdn.creative.medialytics.com',
  189. 'act.commercial.shouji.360.cn',
  190. 'px.cdn.creative.medialytics.com'
  191. ]);
  192. });
  193. it('should dedupe subdomain properly', () => {
  194. const trie = createTrie([
  195. 'skk.moe',
  196. 'anotherskk.moe',
  197. 'blog.anotherskk.moe',
  198. 'blog.skk.moe'
  199. ], true);
  200. expect(trie.dump()).toStrictEqual([
  201. 'skk.moe',
  202. 'anotherskk.moe',
  203. 'blog.skk.moe',
  204. 'blog.anotherskk.moe'
  205. ]);
  206. });
  207. it('should efficiently whitelist domains', () => {
  208. const trie = createTrie([
  209. 'skk.moe',
  210. 'anotherskk.moe',
  211. 'blog.anotherskk.moe',
  212. 'blog.skk.moe',
  213. '.cdn.local',
  214. 'blog.img.skk.local',
  215. 'img.skk.local'
  216. ], true);
  217. expect(trie.dump()).toStrictEqual([
  218. 'skk.moe',
  219. 'anotherskk.moe',
  220. '.cdn.local',
  221. 'blog.skk.moe',
  222. 'blog.anotherskk.moe',
  223. 'img.skk.local',
  224. 'blog.img.skk.local'
  225. ]);
  226. trie.whitelist('.skk.moe');
  227. expect(trie.dump()).toStrictEqual([
  228. 'anotherskk.moe',
  229. '.cdn.local',
  230. 'blog.anotherskk.moe',
  231. 'img.skk.local',
  232. 'blog.img.skk.local'
  233. ]);
  234. trie.whitelist('anotherskk.moe');
  235. expect(trie.dump()).toStrictEqual([
  236. '.cdn.local',
  237. 'blog.anotherskk.moe',
  238. 'img.skk.local',
  239. 'blog.img.skk.local'
  240. ]);
  241. trie.add('anotherskk.moe');
  242. trie.whitelist('.anotherskk.moe');
  243. expect(trie.dump()).toStrictEqual([
  244. '.cdn.local',
  245. 'img.skk.local',
  246. 'blog.img.skk.local'
  247. ]);
  248. trie.whitelist('img.skk.local');
  249. expect(trie.dump()).toStrictEqual([
  250. '.cdn.local',
  251. 'blog.img.skk.local'
  252. ]);
  253. trie.whitelist('cdn.local');
  254. expect(trie.dump()).toStrictEqual([
  255. 'blog.img.skk.local'
  256. ]);
  257. trie.whitelist('.skk.local');
  258. expect(trie.dump()).toStrictEqual([]);
  259. });
  260. it('should whitelist trie correctly', () => {
  261. const trie = createTrie([
  262. '.t.co',
  263. 't.co',
  264. 'example.t.co',
  265. '.skk.moe',
  266. 'blog.cdn.example.com',
  267. 'cdn.example.com'
  268. ], true);
  269. expect(trie.dump()).toStrictEqual([
  270. '.t.co',
  271. '.skk.moe',
  272. 'cdn.example.com', 'blog.cdn.example.com'
  273. ]);
  274. trie.whitelist('.t.co');
  275. expect(trie.dump()).toStrictEqual([
  276. '.skk.moe',
  277. 'cdn.example.com', 'blog.cdn.example.com'
  278. ]);
  279. trie.whitelist('skk.moe');
  280. expect(trie.dump()).toStrictEqual(['cdn.example.com', 'blog.cdn.example.com']);
  281. trie.whitelist('cdn.example.com');
  282. expect(trie.dump()).toStrictEqual(['blog.cdn.example.com']);
  283. });
  284. });