Force replace some HTML tags before sending messages to the search index
authorAlexander Ebert <ebert@woltlab.com>
Wed, 29 Mar 2023 16:24:45 +0000 (18:24 +0200)
committerAlexander Ebert <ebert@woltlab.com>
Wed, 29 Mar 2023 16:24:45 +0000 (18:24 +0200)
commit0bc79023944f35034f153b10e51a69640cb1fa27
treec94284d8b9ebbca271013c0875c9d5e718ac6097
parent5a75686fe56109b8fb5abdf41e80105dacf5ca4e
Force replace some HTML tags before sending messages to the search index

Stripping the HTML can cause certain words to be accidentally joined when there is no symbol between them that is recognized by the tokenizer. Inserting a whitespace at tag positions that are known to be prone is a stop-gap solution until we find a more stable replacement strategy.

See #4652 and WoltLab/com.woltlab.wcf.elasticSearch#14
wcfsetup/install/files/lib/system/search/SearchIndexManager.class.php