<div dir="ltr"><div class="gmail_default" style="font-family:times new roman,serif">really weird. do I need to open a Sword bug? (it might be better if  you could, as you could explain it better than I could, but you're a busy man...)</div><div class="gmail_default" style="font-family:times new roman,serif"><br></div></div><br><div class="gmail_quote gmail_quote_container"><div dir="ltr" class="gmail_attr">On Mon, Apr 14, 2025 at 3:00 PM Karl Kleinpaste <<a href="mailto:karl@kleinpaste.org">karl@kleinpaste.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><u></u>
  
    
  
  <div>
    <div>On 3/29/25 13:30, Fred wrote:<br>
    </div>
    <blockquote type="cite">So
      I fired up Xiphos, installed the 3 greek modules from Crosswire
      and did some searches.
      <div class="gmail_default" style="font-family:times new roman,serif">Oddly enough, doing a
        search for that word, using "exact phrase" says it can be found
        in Matt 8:17, Mark 13:35, II Cor 6:18, II Tim 1:5, Titus 3:9 and
        1 Peter 4:19.</div>
      <div class="gmail_default" style="font-family:times new roman,serif"><br>
      </div>
      <div class="gmail_default" style="font-family:times new roman,serif">doing the same search
        in the tischmorph module turns up only the ones in Rev and II
        Cor.</div>
      <div class="gmail_default" style="font-family:times new roman,serif"><br>
      </div>
      <div class="gmail_default" style="font-family:times new roman,serif">So, looked up the
        matthew reference and find that word isn't there!</div>
      <div class="gmail_default" style="font-family:times new roman,serif">...<br>
      </div>
      <div class="gmail_default" style="font-family:times new roman,serif">Two oddities here,
        anybody got any clues?</div>
    </blockquote>
    <br>
    <font face="FreeSerif">Sorry for being tardy about this, another
      instance of "I marked this for later, then didn't notice when
      'later' came and went..."<br>
      <br>
      The short, useless answer is "I don't have any good explanation."<br>
      <br>
      TischMorph:<br>
      When I search lemma:G3841, I get 10 verses:<br>
      2Cor 6:18; Rev 1:8; 4:8; 11:17; 15:3; 16:7; 16:14; 19:6; 19:15;
      21:22<br>
      Of that, Rev 16:14, 19:15 are included because they are ref'd by
      the same Strong's but in the form παντοκρατορος.<br>
      <br>
      When I search παντοκρατωρ, I get:<br>
      lucene: nothing?<br>
      phrase, regex: The usual 8 verses (above, excluding the 2
      alternates).<br>
      Certainly, I expect lucene search should cough up the same 8.<br>
      <br>
      When I adjust the search term to the more general παντοκρ*, then
      lucene search gives me what I expect. ???<br>
      <br>
      I have no idea how you're getting Matt/Mark/2Tim/Tit/1Pet
      references. I don't see that.<br>
      <br>
      However, when I use diatheke:<br>
    </font><font face="monospace">diatheke -b TischMorph -s lucene -k
      παντοκρατωρ | sed -e 's/8R/8 ; R/' -e 's/II/; II/' | semis | sort</font><font face="FreeSerif"><br>
      ("sed" is to fix some rough output from diatheke)<br>
      then I get the usual 8 verses.<br>
      <br>
      In 2TGreek:<br>
      lucene: nothing?<br>
      regex: The usual 8.<br>
      phrase: The usual 8 plus Mat 8:17; Mark 13:35; 2Tim 1:5, Tit
      3:9?!? But no 1Pet reference.<br>
      This is freakish.<br>
      <br>
      Again, adjust search to use παντοκρ*, I now get a proper set
      including the extras from </font><font face="FreeSerif">παντοκρατορος</font><font face="FreeSerif"> (10 verses).<br>
      How is this distinguished?<br>
      <br>
      I cannot begin to explain any of this. Surely, lucene search
      should be returning the proper set on a no-wildcard single word.
      This suggests to me that there is something funny about how the
      lucene index is being handled.<br>
      "Exact phrase" adding verses that are manifestly not to be
      included is a different sort of problem.<br>
      <br>
      The bottom line for Xiphos is that it turns off Greek Accents and
      uses StripText on search terms (for consistency of "no accents
      that would create false differences"), then executes the search.
      What Xiphos displays is what the engine sends back. Xiphos has no
      more control than that.<br>
      <br>
      I'm thoroughly mystified by all of this, especially since I can
      see that I (being in Xiphos' code) have nothing additional I can
      do about how the search behaves. The code just prepares the search
      terms and hands it off for execution.<br>
      <br>
      I rebuilt lucene indices to ensure there was nothing funny from a
      possibly old index generation.<br>
      <br>
      How can παντοκρατωρ and παντοκρ* produce different lucene results?<br>
    </font>
  </div>
_______________________________________________<br>
sword-devel mailing list: <a href="mailto:sword-devel@crosswire.org" target="_blank">sword-devel@crosswire.org</a><br>
<a href="http://crosswire.org/mailman/listinfo/sword-devel" rel="noreferrer" target="_blank">http://crosswire.org/mailman/listinfo/sword-devel</a><br>
Instructions to unsubscribe/change your settings at above page<br>
</blockquote></div>