Reply to post

Como evitar a leitura de <s>texto tachado<s> (texto riscado/excluído)

Author
Juliano Borotto
User
  • Total Posts : 0
  • Scores: 0
  • Reward points: 0
  • Joined: 2021/08/28 03:45:19
  • Status: offline
2021/08/28 09:42:38 (permalink)
0

Como evitar a leitura de <s>texto tachado<s> (texto riscado/excluído)

Estou com dificuldade em alguns textos de lei que em alguns parágrafos estão tachados pois foram revogados, mas o aplicativo continua lendo normalmente, e o exibe sem estar tachado.

Além do mais, quando importo o texto diretamente de arquivo docx o texto vem no formato bruto (sem formatação de fonte e negrito como acontece no formato PDF).
 
(Automatic translation:)
How to avoid reading <s>Strikethrough text<s> (crossed out/deleted text)
I'm having difficulty in some law texts that in some paragraphs are strikethrough because they were revoked, but the application continues reading normally, and displays it without being strikethrough.
Furthermore, when I import text directly from docx file the text comes in raw format (no font formatting and bold as in PDF format).
post edited by Admin - 2021/08/28 09:57:45

8 Replies Related Threads

    Admin
    Administrator
    • Total Posts : 275
    • Scores: 6
    • Reward points: 0
    • Joined: 2010/11/22 00:00:00
    • Location: USA
    • Status: offline
    Re: Como evitar a leitura de <s>texto tachado<s> (texto riscado/excluído) 2021/08/28 10:10:37 (permalink)
    0
    O texto riscado em arquivos HTML (ou e-book) pode ser silenciado com a função "Editar fala" no menu Configurações do @Voice. Acho que a forma mais correta seria:
     
    <s>Algum texto riscado</s>
     
    Entre na função "Editar fala", pressione o botão + na parte superior para adicionar uma nova substituição de fala e selecione ou digite EXATAMENTE, evitando espaços no campo Padrão:
     
    Tipo: Expressão Regular (RegEx)
    Padrão: <s>.*?</s>|<s(\b.+?>|>).*?</s>
    Substituir:                      deixe vazio
     
    Em seguida, oculte o teclado e pressione o botão Salvar.

    Quanto aos arquivos do MS Word, tenho um código que pode convertê-los apenas em texto simples. Se você quiser todos os estilos, abra esse arquivo no MS Word em seu computador e pressione Arquivo - Salvar como - selecione o formato "Página única da Web (* .mhtl, * .mht)". Mova esse arquivo para um dispositivo Android e abra-o no app @Voice.
     
    (English text:)
    Text crossed out in HTML (or ebook) files can be silenced with the "Edit speech" function on @Voice Settings menu. I think the more correct form would be:
     
    <s>Some text crossed out</s>
     
    Enter the "Edit speech" function, press the + button on top to add a new speech replacement, and select or type EXACTLY this, avoiding any spaces in the Pattern filed:
     
    Type: Regular Expression (RegEx)
    Pattern: <s>.*?</s>|<s(\b.+?>|>).*?</s>
    Replace:             leave empty
     
    Then hide the keyboard and press Save button.
     
    As for MS Word files, I have a code that can convert them to plain text only. If you want all the styles, open that file in MS Word on your computer, then press File - Save As - select "Single Web Page (*.mhtl, *.mht)" format. Move that file to an Android device and open it in @Voice app.
    Juliano Borotto
    User
    • Total Posts : 0
    • Scores: 0
    • Reward points: 0
    • Joined: 2021/08/28 03:45:19
    • Status: offline
    Re: Como evitar a leitura de <s>texto tachado<s> (texto riscado/excluído) 2021/08/28 11:38:38 (permalink)
    0
    A formatação do texto (negrito e itálico) no formato html funcionou perfeitamente.
    Todavia, a expressão regular acima não funcionou no formato docx e também não funcionou no formato html.
    Acredito que o app no momento que faz a importação do texto, não importa ele tachado (riscado), com isso o texto aparece sem estar tachado (riscado) e desta maneira a expressão não funciona.
    Juliano Borotto
    User
    • Total Posts : 0
    • Scores: 0
    • Reward points: 0
    • Joined: 2021/08/28 03:45:19
    • Status: offline
    Re: Como evitar a leitura de <s>texto tachado<s> (texto riscado/excluído) 2021/08/28 12:01:49 (permalink)
    0
    Eu tentei também com os formatos mhtml e pdf e com nenhum deles a expressão funcionou.
    Juliano Borotto
    User
    • Total Posts : 0
    • Scores: 0
    • Reward points: 0
    • Joined: 2021/08/28 03:45:19
    • Status: offline
    Re: Como evitar a leitura de <s>texto tachado<s> (texto riscado/excluído) 2021/08/28 12:07:02 (permalink)
    0
    o senhor teria como me passar uma expressão regular que faça com que o App não leia as informações que estiver entre (parênteses)? Para conseguir este efeito tenho substituído os (parênteses) do texto pela expressão: {{@+parênteses}} mas tem sido muito trabalhoso, pois todos os textos de lei vem formatado desta forma.
    Admin
    Administrator
    • Total Posts : 275
    • Scores: 6
    • Reward points: 0
    • Joined: 2010/11/22 00:00:00
    • Location: USA
    • Status: offline
    Re: Como evitar a leitura de <s>texto tachado<s> (texto riscado/excluído) 2021/08/28 12:34:10 (permalink)
    0
    Se você quiser que eu investigue um arquivo para fornecer expressões para silenciar o texto cruzado, envie-me o arquivo original onde isso ocorre por anexo de e-mail. Só de posse do arquivo original posso ver quais códigos são usados nele e ajustar as expressões.
    Pular a leitura de todo o texto regular (parênteses) provavelmente não é uma boa ideia, existem muitos textos onde isso é importante. Também posso fornecer essa expressão depois de receber o arquivo.
     
     
    If you want me to investigate a file to provide expressions for silencing crossed text, please send me the original file where this occurs by email attachment. Only having the original file I can see what codes are used in it and adjust the expressions. 
    Skipping reading all text in regular (parenthesis) is probably not a good idea, there are many texts where this is important. I can provide such expression too after receiving the file.
    Juliano Borotto
    User
    • Total Posts : 0
    • Scores: 0
    • Reward points: 0
    • Joined: 2021/08/28 03:45:19
    • Status: offline
    Re: Como evitar a leitura de <s>texto tachado<s> (texto riscado/excluído) 2021/08/28 13:06:48 (permalink)
    0
    Ok, envio para qual e-mail?
    Juliano Borotto
    User
    • Total Posts : 0
    • Scores: 0
    • Reward points: 0
    • Joined: 2021/08/28 03:45:19
    • Status: offline
    Re: Como evitar a leitura de <s>texto tachado<s> (texto riscado/excluído) 2021/08/28 13:12:27 (permalink)
    0
    Exemplo de texto legal no link:
    http://www.planalto.gov.b...ecreto-lei/del3689.htm
    Admin
    Administrator
    • Total Posts : 275
    • Scores: 6
    • Reward points: 0
    • Joined: 2010/11/22 00:00:00
    • Location: USA
    • Status: offline
    Re: Como evitar a leitura de <s>texto tachado<s> (texto riscado/excluído) 2021/08/28 17:11:25 (permalink)
    0
    Não faz sentido postar em 2 idiomas, por favor, use o Google Translate se necessário para entender.
     
    You can find my email address in @Voice app "About" screen, or on Google Play store page of @Voice product, or on this web site under "Contacts" link...
     
    As for the link you gave me, I see text "§ 1º (VETADO)." as crossed out. It is made crossed out with CSS styles, so the code to silence this would be more complicated and would only work with this HTML page, as other pages may define styles differently. Specifically the HTML code is:
     
    <span style="font-size:10.0pt;
    font-family:&quot;Arial&quot;,&quot;sans-serif&quot;;color:black; text-decoration:line-through">
    <a name="art3b§1"></a>§ 1º (VETADO).</span>
     
    so the RegEx expression would have to match style attribute containing "text-decoration:line-through". In another place I see a code containing <strike> attribute:
     
    <strike>
    <a name="art4."></a>Art.
    4º A polícia judiciária será exercida pelas autoridades policiais no território de
    suas respectivas jurisdições e terá por fim a apuração das infrações penais e da
    sua autoria.</strike>
     
    This is easier to avoid:
     
    Type: Regular Expression (RegEx)
    Pattern: <strike>.*?</strike>|<strike(\b.+?>|>).*?</strike>
    Replace:             leave empty
     
    However this may not work if long passages (multiple sentences) are contained within one <strike> tag. An even more complex site specific filter would be needed.
    Jump to:
    © 2024 APG vNext Commercial Version 5.1